# grunden.ai

> Svensk EU-AI: GLM 5.1 (754B MoE, 200K context, MIT-licens) för chat plus
> en specialiserad modell-flotta (tal-till-text, text-till-tal, embeddings,
> rerank, PII-detektering) på egen NVIDIA H200-hårdvara i Stockholm.
> OpenAI-kompatibelt API — byt endpoint, behåll din kod. Gratis chat,
> prenumeration eller förbetald wallet. Svensk bokföring och kontantfaktura
> vid varje betalning.

## Om tjänsten

grunden.ai servar GLM 5.1 (open-weight flaggskeppsmodell från Z.ai) plus
en specialiserad modell-flotta (KB-Whisper-Large STT, Chatterbox TTS,
BGE-M3 embeddings, BGE-reranker-v2-m3 rerank, GLiNER PII) via ett
OpenAI-kompatibelt API och ett webbgränssnitt. All inferens körs på egen
NVIDIA H200-hårdvara i Stockholm — inga externa modell-leverantörer.
Utfärdare: Grunden AI AB (org.nr 559341-9129, VAT SE559341912901).

## Produkter

- [Chat-gränssnitt](https://grunden.ai/chat): webbaserad chat med GLM 5.1.
  7 dagars gratis vid nyregistrering, sen 3 promptar/dag utan abonnemang.
- [Publikt API](https://grunden.ai/docs): OpenAI-kompatibelt API med chat, audio
  (tal-till-text + text-till-tal), embeddings, rerank och PII-detektering.
  Bearer-autentisering med API-nyckel som börjar på `sk-grunden-`.

## Dokumentation (kom-igång för LLM-agenter)

- [Kom igång](https://grunden.ai/docs): registrering, första API-anrop, redigerings-
  integration (Cursor/Continue/Roo).
- [Kapaciteter — översikt](https://grunden.ai/docs/kapaciteter): paraply över sex
  modeller. Klicka per kapacitet för anropssyntax + curl-exempel.
  - [Chat (GLM 5.1)](https://grunden.ai/docs/kapaciteter/chat) — `POST /v1/chat/completions`,
    streaming, tool-calling.
  - [Tal-till-text (KB-Whisper-Large)](https://grunden.ai/docs/kapaciteter/tal-till-text) —
    `POST /v1/audio/transcriptions` (batch) + `WSS /v1/audio/realtime`
    (WebSocket-streaming).
  - [Text-till-tal (Chatterbox)](https://grunden.ai/docs/kapaciteter/text-till-tal) —
    `POST /v1/audio/speech`. WAV ut + `X-AI-Generated`-header (AI Act 50.2).
  - [Embeddings (BGE-M3)](https://grunden.ai/docs/kapaciteter/embeddings) —
    `POST /v1/embeddings`. 1024-dim multilingual för RAG/sök.
  - [Rerank (BGE-reranker-v2-m3)](https://grunden.ai/docs/kapaciteter/rerank) —
    `POST /v1/rerank`. Cross-encoder för precis sökning.
  - [PII-detektering (GLiNER)](https://grunden.ai/docs/kapaciteter/pii) —
    `POST /v1/pii/redact`. Personnummer, namn, e-post, telefon, adress.
- [Guider](https://grunden.ai/docs/guider): avancerade mönster — streaming, tool-calling,
  async-jobb, RAG, idempotency.
- [Modeller & priser](https://grunden.ai/docs/modeller): full pris-tabell, tiers
  (normal / priority / async).
- [API-referens](https://grunden.ai/docs/api): bas-URL, alla endpoints i tabellform,
  felkoder, autentiserings-detaljer.
- [Konto & fakturering](https://grunden.ai/docs/konto): API-nycklar, wallet, abonnemang,
  kvittohistorik, bug-reports.
- [Compliance & EU](https://grunden.ai/docs/compliance): GDPR, AI Act, EU-jurisdiktion,
  DPIA, DPA, modell-licensiering.

## Maskinläsbara resurser

- [llms-full.txt](https://grunden.ai/llms-full.txt): längre version med full API-detalj.
- [OpenAPI-spec](https://grunden.ai/openapi.json): maskinläsbar spec (OpenAPI 3.1).
- [AI-plugin manifest](https://grunden.ai/.well-known/ai-plugin.json): generic-agent
  discovery-manifest.
- [MCP discovery](https://grunden.ai/.well-known/mcp): server-card för MCP-medvetna
  klienter (Cursor, Claude Desktop, opencode). Vi har ingen managed MCP-
  server idag — kortet förklarar att vi exponerar OpenAI-kompatibelt API
  istället, listar capabilities och planerad MCP-roadmap.
- [Sitemap](https://grunden.ai/sitemap.xml): full URL-lista.

## För LLM-agenter

Skicka `Accept: text/markdown`-header (eller använd en känd AI-bot
user-agent: GPTBot/ClaudeBot/anthropic-ai/Google-Extended/PerplexityBot/
ChatGPT-User) på `/docs`-paths så får du markdown istället för full HTML.
Reducerar context-användning ~80%.
- [Modellkatalog (UI)](https://grunden.ai/modeller): live-uppdaterad lista med pris per 1M tokens.
- [Varför grunden.ai](https://grunden.ai/varfor): positionering.
- [Status](https://grunden.ai/status): driftstatus.
- [Support](https://grunden.ai/support): kontaktkanaler, rate limits, webhook-signaturer.

## Aktuella modeller

- `bge-reranker-v2-m3` — rerank
- `bge-m3` — embedding
- `chatterbox` — tts
- `gliner-multi-pii` — pii
- `glm-5.1` — chat
- `kb-whisper-large` — stt

## Prismodell

- **Gratis-läge (chat)**: nya konton får 7 dagars obegränsad chat. Därefter
  3 promptar/dag utan abonnemang. Rate limit per session.
- **Chatt-abonnemang**: 99 kr/mån inkl. moms (eller 990 kr/år) ger obegränsad
  chat med GLM 5.1, med en daglig token-cap som anti-missbruk.
- **Förbetald wallet (API)**: fyll på saldo via kort (Mollie) och
  debiteras per token (chat) eller per minut / per 1M tecken / per 1k queries
  (specialmodeller). Chat-pris (SEK per 1M tokens, input/output): Normal
  60/180 · Priority (2×) 120/360 · Async (½×, webhook inom 12 h) 30/90.
  Kontantfaktura ställs ut automatiskt vid varje betalning enligt
  Bokföringslagen. Standardvaluta: SEK. Beta-fasen är gratis — vi spårar
  usage men debiterar inte ännu.

## API-endpoints

- Bas-URL (prod): `https://api.grunden.ai`
- Bas-URL (staging): `https://staging.grunden.ai` (icke-stabil, inga SLA)
- `POST /v1/chat/completions` — chat completions (JSON eller SSE via `stream:true`)
- `POST /v1/audio/transcriptions` — tal-till-text (multipart, KB-Whisper-Large)
- `WSS  /v1/audio/realtime` — realtime tal-till-text (WebSocket, PCM-frames)
- `POST /v1/audio/speech` — text-till-tal (Chatterbox, WAV ut)
- `POST /v1/embeddings` — embeddings (BGE-M3, 1024-dim)
- `POST /v1/rerank` — cross-encoder rerank (BGE-reranker-v2-m3)
- `POST /v1/pii/redact` — PII-detektering och -maskering (GLiNER)
- `GET  /v1/models` — listar aktiva modeller (kräver `Authorization: Bearer sk-grunden-…`)
- `GET  /v1/batch/{id}` — status för async batch-jobb
- Autentisering: `Authorization: Bearer sk-grunden-…`
- Format: OpenAI-kompatibel JSON (utom audio som använder multipart in / WAV ut)

## Request-features

- **Streaming**: `stream: true` → SSE-chunks i OpenAI delta-format.
- **Vision**: GLM 5.1 i nuvarande deploy är text-only. Vision-stöd
  återkommer när relevant capability publiceras live (se `GET /v1/models`).
- **Tool-calling**: `tools` + `tool_choice` på request, `tool_calls` i assistant-svaret, `role:"tool"` med `tool_call_id` för resultatet.
- **Async-tier**: `tier:"async"` + `webhook_url` → 202 med jobb-id, resultat via webhook signerad med HMAC-SHA256 i `X-Grunden-Signature`-header. Webhook levereras inom 12 timmar.
- **Idempotency**: `Idempotency-Key` header (UUID/ULID, max 128 tecken) för säkra retries — samma nyckel inom 24h returnerar cache:ad response utan ny debitering.
- **Rate-limit-signaler**: `Retry-After` + `X-RateLimit-Remaining-Requests` + `X-RateLimit-Remaining-Tokens` headers på 429-svar.

## Juridik och compliance

- [Användarvillkor](https://grunden.ai/terms)
- [Integritetspolicy](https://grunden.ai/privacy)
- [Data Processing Agreement (DPA)](https://grunden.ai/dpa) — för B2B-personuppgifts-
  behandling.
- [AI-förordningen (EU AI Act)](https://grunden.ai/ai-act) — vår roll som distributör
  av GLM 5.1 (GPAI) och kundens ansvar.

## Kontakt

- hej@grunden.ai — allmänna frågor och support
- privacy@grunden.ai — GDPR / personuppgifter
- security@grunden.ai — säkerhetsincidenter