# grunden.ai > Svensk EU-AI: GLM 5.1 (754B MoE, 200K context, MIT-licens) för chat plus > en specialiserad modell-flotta (tal-till-text, text-till-tal, embeddings, > rerank, PII-detektering) på egen NVIDIA H200-hårdvara i Stockholm. > OpenAI-kompatibelt API — byt endpoint, behåll din kod. Gratis chat, > prenumeration eller förbetald wallet. Svensk bokföring och kontantfaktura > vid varje betalning. ## Om tjänsten grunden.ai servar GLM 5.1 (open-weight flaggskeppsmodell från Z.ai) plus en specialiserad modell-flotta (KB-Whisper-Large STT, Chatterbox TTS, BGE-M3 embeddings, BGE-reranker-v2-m3 rerank, GLiNER PII) via ett OpenAI-kompatibelt API och ett webbgränssnitt. All inferens körs på egen NVIDIA H200-hårdvara i Stockholm — inga externa modell-leverantörer. Utfärdare: Grunden AI AB (org.nr 559341-9129, VAT SE559341912901). ## Produkter - [Chat-gränssnitt](https://grunden.ai/chat): webbaserad chat med GLM 5.1. 7 dagars gratis vid nyregistrering, sen 3 promptar/dag utan abonnemang. - [Publikt API](https://grunden.ai/docs): OpenAI-kompatibelt API med chat, audio (tal-till-text + text-till-tal), embeddings, rerank och PII-detektering. Bearer-autentisering med API-nyckel som börjar på `sk-grunden-`. ## Dokumentation (kom-igång för LLM-agenter) - [Kom igång](https://grunden.ai/docs): registrering, första API-anrop, redigerings- integration (Cursor/Continue/Roo). - [Kapaciteter — översikt](https://grunden.ai/docs/kapaciteter): paraply över sex modeller. Klicka per kapacitet för anropssyntax + curl-exempel. - [Chat (GLM 5.1)](https://grunden.ai/docs/kapaciteter/chat) — `POST /v1/chat/completions`, streaming, tool-calling. - [Tal-till-text (KB-Whisper-Large)](https://grunden.ai/docs/kapaciteter/tal-till-text) — `POST /v1/audio/transcriptions` (batch) + `WSS /v1/audio/realtime` (WebSocket-streaming). - [Text-till-tal (Chatterbox)](https://grunden.ai/docs/kapaciteter/text-till-tal) — `POST /v1/audio/speech`. WAV ut + `X-AI-Generated`-header (AI Act 50.2). - [Embeddings (BGE-M3)](https://grunden.ai/docs/kapaciteter/embeddings) — `POST /v1/embeddings`. 1024-dim multilingual för RAG/sök. - [Rerank (BGE-reranker-v2-m3)](https://grunden.ai/docs/kapaciteter/rerank) — `POST /v1/rerank`. Cross-encoder för precis sökning. - [PII-detektering (GLiNER)](https://grunden.ai/docs/kapaciteter/pii) — `POST /v1/pii/redact`. Personnummer, namn, e-post, telefon, adress. - [Guider](https://grunden.ai/docs/guider): avancerade mönster — streaming, tool-calling, async-jobb, RAG, idempotency. - [Modeller & priser](https://grunden.ai/docs/modeller): full pris-tabell, tiers (normal / priority / async). - [API-referens](https://grunden.ai/docs/api): bas-URL, alla endpoints i tabellform, felkoder, autentiserings-detaljer. - [Konto & fakturering](https://grunden.ai/docs/konto): API-nycklar, wallet, abonnemang, kvittohistorik, bug-reports. - [Compliance & EU](https://grunden.ai/docs/compliance): GDPR, AI Act, EU-jurisdiktion, DPIA, DPA, modell-licensiering. ## Maskinläsbara resurser - [llms-full.txt](https://grunden.ai/llms-full.txt): längre version med full API-detalj. - [OpenAPI-spec](https://grunden.ai/openapi.json): maskinläsbar spec (OpenAPI 3.1). - [AI-plugin manifest](https://grunden.ai/.well-known/ai-plugin.json): generic-agent discovery-manifest. - [MCP discovery](https://grunden.ai/.well-known/mcp): server-card för MCP-medvetna klienter (Cursor, Claude Desktop, opencode). Vi har ingen managed MCP- server idag — kortet förklarar att vi exponerar OpenAI-kompatibelt API istället, listar capabilities och planerad MCP-roadmap. - [Sitemap](https://grunden.ai/sitemap.xml): full URL-lista. ## För LLM-agenter Skicka `Accept: text/markdown`-header (eller använd en känd AI-bot user-agent: GPTBot/ClaudeBot/anthropic-ai/Google-Extended/PerplexityBot/ ChatGPT-User) på `/docs`-paths så får du markdown istället för full HTML. Reducerar context-användning ~80%. - [Modellkatalog (UI)](https://grunden.ai/modeller): live-uppdaterad lista med pris per 1M tokens. - [Varför grunden.ai](https://grunden.ai/varfor): positionering. - [Status](https://grunden.ai/status): driftstatus. - [Support](https://grunden.ai/support): kontaktkanaler, rate limits, webhook-signaturer. ## Aktuella modeller - `bge-reranker-v2-m3` — rerank - `bge-m3` — embedding - `chatterbox` — tts - `gliner-multi-pii` — pii - `glm-5.1` — chat - `kb-whisper-large` — stt ## Prismodell - **Gratis-läge (chat)**: nya konton får 7 dagars obegränsad chat. Därefter 3 promptar/dag utan abonnemang. Rate limit per session. - **Chatt-abonnemang**: 99 kr/mån inkl. moms (eller 990 kr/år) ger obegränsad chat med GLM 5.1, med en daglig token-cap som anti-missbruk. - **Förbetald wallet (API)**: fyll på saldo via kort (Mollie) och debiteras per token (chat) eller per minut / per 1M tecken / per 1k queries (specialmodeller). Chat-pris (SEK per 1M tokens, input/output): Normal 60/180 · Priority (2×) 120/360 · Async (½×, webhook inom 12 h) 30/90. Kontantfaktura ställs ut automatiskt vid varje betalning enligt Bokföringslagen. Standardvaluta: SEK. Beta-fasen är gratis — vi spårar usage men debiterar inte ännu. ## API-endpoints - Bas-URL (prod): `https://api.grunden.ai` - Bas-URL (staging): `https://staging.grunden.ai` (icke-stabil, inga SLA) - `POST /v1/chat/completions` — chat completions (JSON eller SSE via `stream:true`) - `POST /v1/audio/transcriptions` — tal-till-text (multipart, KB-Whisper-Large) - `WSS /v1/audio/realtime` — realtime tal-till-text (WebSocket, PCM-frames) - `POST /v1/audio/speech` — text-till-tal (Chatterbox, WAV ut) - `POST /v1/embeddings` — embeddings (BGE-M3, 1024-dim) - `POST /v1/rerank` — cross-encoder rerank (BGE-reranker-v2-m3) - `POST /v1/pii/redact` — PII-detektering och -maskering (GLiNER) - `GET /v1/models` — listar aktiva modeller (kräver `Authorization: Bearer sk-grunden-…`) - `GET /v1/batch/{id}` — status för async batch-jobb - Autentisering: `Authorization: Bearer sk-grunden-…` - Format: OpenAI-kompatibel JSON (utom audio som använder multipart in / WAV ut) ## Request-features - **Streaming**: `stream: true` → SSE-chunks i OpenAI delta-format. - **Vision**: GLM 5.1 i nuvarande deploy är text-only. Vision-stöd återkommer när relevant capability publiceras live (se `GET /v1/models`). - **Tool-calling**: `tools` + `tool_choice` på request, `tool_calls` i assistant-svaret, `role:"tool"` med `tool_call_id` för resultatet. - **Async-tier**: `tier:"async"` + `webhook_url` → 202 med jobb-id, resultat via webhook signerad med HMAC-SHA256 i `X-Grunden-Signature`-header. Webhook levereras inom 12 timmar. - **Idempotency**: `Idempotency-Key` header (UUID/ULID, max 128 tecken) för säkra retries — samma nyckel inom 24h returnerar cache:ad response utan ny debitering. - **Rate-limit-signaler**: `Retry-After` + `X-RateLimit-Remaining-Requests` + `X-RateLimit-Remaining-Tokens` headers på 429-svar. ## Juridik och compliance - [Användarvillkor](https://grunden.ai/terms) - [Integritetspolicy](https://grunden.ai/privacy) - [Data Processing Agreement (DPA)](https://grunden.ai/dpa) — för B2B-personuppgifts- behandling. - [AI-förordningen (EU AI Act)](https://grunden.ai/ai-act) — vår roll som distributör av GLM 5.1 (GPAI) och kundens ansvar. ## Kontakt - hej@grunden.ai — allmänna frågor och support - privacy@grunden.ai — GDPR / personuppgifter - security@grunden.ai — säkerhetsincidenter