Datacenter i EU · EU-jurisdiktion · OpenAI-kompatibelt API
GRUNDEN.AIbeta
Alla inlägg
25 juni 2026 · GLM 5.2 · open-weights · suveränitet · benchmarks · svensk AI · infrastruktur

GLM 5.2 är live på Grunden — och gapet till frontier är inte vad det var

av Fredrik Andersson
GLM 5.2 är live på Grunden — och gapet till frontier är inte vad det var

GLM 5.2 är live på Grunden

Z.AI släppte GLM 5.2 den 16 juni. Sedan den 17 juni kör alla våra kunder på den.

Det jag inte trodde skulle hända så snabbt har just hänt. På flera coding-benchmarks slår den nya öppna modellen GPT-5.5. På det svåraste long-horizon-testet ligger den 1% från Claude Opus 4.8. Och den kostar runt en sjättedel av vad GPT-5.5 kostar.

Vad siffrorna säger

Z.AI har själva publicerat resultaten i sin dokumentation. Jag har lyft de tre viktigaste i en tabell:

BenchmarkGLM 5.2GPT-5.5Claude Opus 4.8GLM 5.1
SWE-bench Pro62.158.658.4
Terminal-Bench 2.181.085.062.0
FrontierSWE74.4%72.6%75.1%

SWE-bench Pro är det test som närmast efterliknar riktigt utvecklingsarbete. Där ligger GLM 5.2 på 62.1 mot GPT-5.5:s 58.6. Det är första gången jag sett en öppen modell ligga över ett OpenAI-flaggskepp på just det testet.

Terminal-Bench gick från 62.0 i 5.1 till 81.0 i 5.2. Den siffran ligger bara fyra poäng från Claude Opus 4.8. Jag har försökt mota den kurvan i månader i mitt huvud, och plötsligt har den kommit ifatt.

På FrontierSWE, det mest avancerade testet för långa coding-uppgifter, är gapet till Opus 4.8 nere på 1%.

Den underrapporterade nyheten: 1 miljon tokens som fungerar på riktigt

Massor av modeller annonserar 1M kontextfönster. Få håller hela vägen. Kvaliteten börjar oftast kollapsa långt innan man når slutet av kontexten.

GLM 5.2 har specialtränats i månader på just långa kontexter. Z.AI kallar det "solid 1M lossless context", och det är förmodligen den enskilt största praktiska skillnaden i hela släppet.

Vad det betyder konkret: ett helt repo kan ligga inne i en enda inferens. En lång refaktorering kan köras hela vägen utan att modellen tappar tråden halvvägs. Det är den typen av arbete jag själv försökt göra med stängda modeller och blivit bromsad av context-gränser.

En sjättedel av kostnaden

Enligt VentureBeats genomgång ligger GLM 5.2 på ungefär en sjättedel av GPT-5.5:s pris för samma arbete. På volym blir det tusentals euro i månaden i skillnad.

För dig som bygger agenter eller långa kedjor är det en helt annan kalkyl. Inte en optimering.

Det här märker du som kör hos oss

Tre saker händer.

Du behöver inte ändra något. API:et är OpenAI-kompatibelt så ditt nästa anrop går på 5.2 automatiskt. Det är därför vi valde den arkitekturen från början.

Du kan börja stoppa in större kontexter. Hela utredningar, hela årsredovisningar, hela repon. Med vetskapen att datan stannar i Sverige.

Du betalar inte mer. Vi har inte höjt priserna trots att modellen är mer kapabel. Lägre kostnad är en av poängerna med open-weights, och den vill jag att du ska få ta del av.

Vad det här bekräftar

När vi lanserade i maj sa jag att gapet mellan de bästa öppna och de bästa stängda modellerna mäts i månader, inte år. Med 5.2 är det på flera benchmarks redan slutet.

Det förändrar i grunden samtalet jag möter när jag sitter ner med kunder. Förr handlade det om "kan vi få samma prestanda om vi väljer en suverän tjänst?". Nu handlar det om "vill vi fortsätta betala dyrare för data som hamnar under CLOUD Act?"

Den enda fråga som återstår är vilken jurisdiktion man väljer för datan som faktiskt passerar modellen. Vi väljer svensk lag. Inget moderbolag i USA. Hela kedjan under EU-rätt.

Kom igång

Är du redan kund? Du behöver inte göra något. Nästa anrop ligger på 5.2.

Är du inte kund än? Du får 7 dagar gratis chat och 10 kronor i API-krediter att testa med på grunden.ai. Bygger du något som kräver suverän inferens och vill prata om enterprise, mejla mig direkt på fredrik@grunden.ai.


Källor:

GLM 5.2 är live på Grunden — och gapet till frontier är inte vad det var — grunden.ai