Träningsplan: Råa korpusar → städning & filtrering → versionerade datasets → träningskluster → checkpoints → modellregister (signerade artefakter).
Inferensplan: Edge → API-gateway → IdP → pre-filter (klassificerare) → tokenizer → modell + KV-cache + hjälpmodeller → ev. RAG/verktyg → post-filter → svar tillbaka.
Tvärgående: Identitet, observability, hemlighetshantering, region-routing, DSR-pipeline och eval/red-team verkar över båda planen.
Offline pipeline för datainsamling och modellframställning
Batch · Långa retentionstiderA.01 Datainsamling (Behandlar personuppgifter) Webbcrawling, licensierade korpusar, böcker, kod, syntetisk data.
- Rättslig grund för personuppgiftsbehandling enligt Art. 6 GDPR
- Efterlevnad av källvillkor: robots.txt, ToS, licenser och upphovsrätt
- Spårbarhet/lineage per dataset, källversionering
- PII- och CSAM-detektion i råform innan ingest
- Avtal med dataleverantörer, IP/upphovsrätt
A.02 Bearbetningspipeline (Behandlar personuppgifter) Deduplicering, kvalitetsfilter, PII-skrubbare, toxicitetsfilter, tokenisering.
- Effektivitet och false-negative-rate på PII-filter
- Manipulering/förgiftning i pipeline-steg (data poisoning)
- Reproducerbarhet — samma input → samma utdata
- Privilegierad åtkomst till bearbetningsjobb
A.03 Data lake / warehouse (Behandlar personuppgifter) Petabytestor lagring av råa och kuraterade dataset, ofta versionerade.
- Kryptering at-rest, nyckelförvaltning (KMS/HSM)
- Åtkomstkontroll, segregering forskning vs produktion
- Retention för rådata, raderingsbevis
- Geografi/dataresidens för känsliga korpusar
A.04 RLHF-/preferensdata (Behandlar personuppgifter) Mänskligt märkta jämförelser och annoteringar för alignment.
- Annotörers arbetsmiljö och avtalsrättsliga frågor
- Personuppgifter om annotörerna själva (logg, metadata)
- Bias och representativitet i annoteringspopulation
- Kvalitetskontroll, kalibrering, IAA-mått
A.05 Träningskluster GPU/TPU-kluster, distribuerad orkestrering, jobb-schedulers.
- Hårdvaruleverantörsförtroende (firmware, driver)
- Multi-tenant separation, sidokanaler
- Privilegierad åtkomst, MFA på adminportaler
- Härdning av nodavbildningar
A.06 Checkpoint-lagring Mellanliggande viktversioner under träning, ofta TB stora per checkpoint.
- Integritet och signering av checkpoints
- Risk för viktexfiltrering (kritisk IP)
- Loggning av läs-/skrivoperationer
- Backup-strategi och immutability
A.07 Experimentspårning (Behandlar personuppgifter) Hyperparametrar, mätvärden, körningshistorik (typ Weights & Biases).
- Läckage av interna metoder/IP via metadata
- Forskaridentiteter och beteendelogg
- Integration med molntjänst (tredje part?)
A.08 Modellregister Slutgiltiga vikter, tokenizers, adapters/LoRA, modellkort.
- Signering, attestering (provenance, SLSA-liknande)
- Promotion-flow training → staging → prod
- Modellkort + eval-rapporter knutna till version
- Återkallning vid säkerhetsincident
Online tjänsteyta som hanterar användarprompter i realtid
Realtid · Användardata · Multi-tenantB.01 Edge / Nätverk (Behandlar personuppgifter) CDN, WAF, DDoS-skydd, TLS-terminering, geo-routing.
- TLS-konfiguration, cert-livscykel
- WAF/regler för kända mönster; prompt-injection-kontroller även i app-, RAG- och modellflöde
- Region-routing tvingande för EU-trafik
- Logg av rate-limit-händelser till SIEM
B.02 API-gateway (Behandlar personuppgifter) Routing, auth, kvoter, request/response-loggning.
- Vad loggas? (full prompt eller bara metadata?)
- Loggretention och åtkomst för incident vs produktanalys
- API-nyckelrotation, scope-design
- Tenant-isolering på request-nivå
- Resurs-/kostnadsattacker: tokenbudget, rate limits, parallella requests, långa kontexter (OWASP LLM10:2025 Unbounded Consumption)
B.03 Tokenizer (Behandlar personuppgifter) Deterministisk omvandling text ↔ tokens innan modellanrop.
- Versionsparitet med tränad modell
- Glitch-tokens / oväntade token-mappningar
- Tokenizer-bypass via Unicode-tricks
B.04 Input-klassificerare (Behandlar personuppgifter) Hjälpmodeller för jailbreak-, abuse-, CSAM- och PII-detektion innan huvudmodellen.
- False-negative-rate, evasionstest
- Egen modellkedja → samma riskprofil som A.08
- Loggning av blockerade prompter (känsligt!)
- Versionssynkning med policymotor
B.05 Inferens-runtime (Behandlar personuppgifter) Själva modellservern: laddar vikter, kör forward-pass, hanterar batchning.
- Minneshygien mellan requests (tenant-läckage)
- Sidokanaler via timing/cache
- Härdning av runtime-noden
- Hot reload av vikter — signaturkontroll
- Separation mellan systeminstruktioner, verktygsbeskrivningar och användar-/RAG-innehåll (OWASP LLM07:2025 System Prompt Leakage)
B.06 KV-cache (Behandlar personuppgifter) Mellanlagrad attention-state under en session — känslig representationsdata härledd från prompt och kontext.
- Cache-isolering per session/tenant
- Prefix-sharing optimering — läckagerisk?
- Persistens (RAM-only? swap till disk?)
- Rensning vid session-slut, retention
B.07 Hjälpmodeller (Behandlar personuppgifter) Embedding, reranker, reward, klassificerare — egna modellkedjor med egen livscykel.
- Inventering av alla modeller i flödet, inte bara huvud-LLM
- Versionsmatris hjälpmodeller × huvudmodell
- Bias och fairness i klassificerare
B.08 Output-filter (Behandlar personuppgifter) Streaming-klassificerare som granskar genererad text och kan avbryta/redigera.
- Latens-vs-noggrannhet trade-off
- Risk för att modellen läcker träningsdata (memorization)
- Citationsmekanik och attributionsspår
B.09 Konversations-DB (Behandlar personuppgifter) Persistent lagring av användarens chattar, ofta med projektstruktur.
- Kryptering at-rest, nyckel per tenant
- DSR-flöde: åtkomst/export, rättelse, radering, dataportabilitet (Art. 15–20)
- Retentionpolicy och raderingsbevis
- Backup vs raderingskonflikt
B.10 Minne / personalisering (Behandlar personuppgifter) Strukturerad sammanfattning av användarprofil som injiceras i kommande prompter.
- Transparens — användaren ser och kan redigera
- Särskilda kategorier av personuppgifter (Art. 9) bör ej memoreras
- Opt-in/opt-out, default-läge
- Profilering och ev. Art. 22-risk om minnet används i helt automatiserade beslut med rättslig eller liknande betydande effekt
B.11 Användaruppladdade filer (Behandlar personuppgifter) Bilder, PDF:er, kod, dokument som användare bifogar till sessionen.
- Malware-skanning före processering
- Tredjepartsdata: lagligt stöd när användaren laddar upp om andra
- Retention separat från konversationen
- Användning för träning — tydligt opt-in?
B.12 Vector store / RAG (Behandlar personuppgifter) Embeddings av användarens dokument för semantisk sökning.
- Embeddings kan utgöra personuppgifter när de härrör från personuppgifter eller kan kopplas tillbaka till en identifierad eller identifierbar person — särskilt om de kan sökas, jämföras, länkas till konto/tenant eller delvis inverteras
- Tenant-segmentering på vektor-nivå
- Behörighetsmedveten retrieval: dokumentets ACL måste följa med hela vägen till embedding, index och sökresultat
- Indirekt prompt injection från hämtade dokument — RAG-källor behandlas som otillförlitligt innehåll
- Radering: även embeddings, inte bara källfilen
B.13 Verktyg & sandlådor (Behandlar personuppgifter) Code interpreter, webbläsning, filsystem per session, MCP-konnektorer.
- Sandbox-isolering (containers, gVisor, Firecracker)
- Egress-kontroll, SSRF-skydd vid web-fetch
- OAuth-scope minimering för tredjepartskonnektorer (least privilege)
- Exfiltration via verktygsanrop initierade av modellen
- Human approval för högriskåtgärder; verktygsanrop hanteras i kod, inte enbart av modellen
B.14 Återkopplings-/feedbackdata (Behandlar personuppgifter) Tummen upp/ner, flagga, redigeringar — kan flöda tillbaka till A.04.
- Tydligt rättsligt stöd för återanvändning till träning
- Minimering och pseudonymisering före A-planet; anonymisering endast om irreversibel och verifierad
- Spårbarhet från feedback till framtida modellversion
Funktioner som verkar över både tränings- och inferensplan
Identitet · Observability · GovernanceC.01 Identity Provider (IdP) (Behandlar personuppgifter) SSO/OAuth, MFA, kontoregister, API-nycklar.
- MFA-täckning, lösenfri inloggning
- Nyckelrotation och scope-modell
- Federation mot kund-IdP (Enterprise SSO)
- Account-takeover-detektion
C.02 Hemligheter / KMS Centraliserad nyckel- och hemlighetshantering, HSM-backad.
- Nyckel-livscykel, separation of duties
- BYOK/HYOK-stöd för enterprise
- Krypto-agility inför PQC-övergång
C.03 Observability (Behandlar personuppgifter) Loggar, metrics, distributed tracing, audit trail. Volym och retention bör riskklassas separat.
- PII-skrubb i loggrader, sampling vs fullständighet
- Logg-immutability och tamper-evident store
- Åtkomst för incident vs produktanalys
- Retention på loggar är ofta längst kvarvarande PD
C.04 DSR-pipeline (Behandlar personuppgifter) Tekniskt flöde för export, radering, rättelse, dataportabilitet.
- Täckning över alla lager: B.09, B.10, B.12, C.03
- Backup-undantag och dokumenterad motivation
- SLA mot lagkrav (1 mån + 2 mån förlängning)
- Bevis på utförd radering
C.05 Region-routing Mekanism som tvingar trafik och lagring till valt geografiskt område.
- Vilka komponenter omfattas? (KV-cache, loggar, embeddings?)
- Failoverscenario — får trafik lämna regionen?
- Tredjelandsöverföring för supportärenden?
C.06 Policy & governance (Behandlar personuppgifter) Styrdokument, modellkort, eval-rapporter, samtyckeshantering.
- Modellkort + DPIA/riskbedömning vid ny eller ändrad högriskbehandling
- AI Act-klassificering: AI-system, AI-modell för allmänna ändamål (GPAI), ev. GPAI med systemrisk
- Spec/Constitution dokumenterad, ägd och versionsspårbar; publicerad externt där lämpligt
C.07 Eval & red-team Testdataset, automatiska benchmarks, mänsklig red-teaming, jailbreak-bibliotek.
- Eval-resultat kopplade till release-beslut
- Testdatasets — risk att de läcker till träning
- Red-team-prompter klassade som hemliga
C.08 Incident- & abuse-response (Behandlar personuppgifter) Detektion, eskalering, modellrollback, kundnotifiering.
- 72-timmarsflöde mot tillsynsmyndighet
- Modellrollback som ett stöddokumenterat scenario
- Kommunikation till kundDPO / personuppgiftsbiträden
Angreppsvägar som löper genom hela kedjan
Förgiftning · Försörjningskedja · ProveniensD.01 Dataförgiftning Manipulerad tränings-, finjusterings- eller RAG-/feedbackdata som planterar bias, bakdörrar eller felaktigt beteende.
- Härkomst och kvalitetskontroll av tränings- och finjusteringsdata; signering eller hashning av dataset (jfr A.04)
- RAG-källor och användarfeedback som förgiftningsväg — feedbackloopar tillbaka till träning (B.14 → A.04) ska granskas, inte bara den direkta prompten
- Avgränsning och validering av databidrag; spårbarhet för vem som bidragit med vad
- Eval- och red-team-svit som fångar bakdörrar och triggers före release (jfr C.07)
D.02 Modellförgiftning & bakdörrar Komprometterade modellvikter — förtränade modeller, finjusteringar eller adaptrar (t.ex. LoRA) med inbyggda bakdörrar eller dolt beteende.
- Proveniens för förtränade vikter och adaptrar — betrodd källa, signerade checkpoints, verifierade hashar
- Deserialisering av modellfiler som körkodsrisk (osäkra format som pickle) — föredra säkra format (t.ex. safetensors)
- Behörighet och granskning vid byte av modellversion i drift; modellrollback som dokumenterat scenario (jfr C.08)
- Modellkort och eval före produktionssättning av ny eller utbytt modell (jfr C.06/C.07)
D.03 Försörjningskedja (programvara, modeller, data) Tredjepartsbibliotek, basmodeller, dataset, modellhubbar och hjälpmodeller — varje länk är en angreppsyta.
- SBOM för programvaruberoenden och en motsvarande förteckning över modeller, dataset och adaptrar (MBOM/”AI-BOM”)
- Sårbarhetshantering och versionslåsning för bibliotek; granskning av paket från publika register
- Licens- och proveniensvillkor för basmodeller, dataset och hjälpmodeller — och vad de innebär för dataskydd och vidareanvändning
- Leverantörs- och biträdesbedömning för externa modell- eller inferens-API:er (jfr metodens leverantörssteg och DORA-relaterad ICT-risk där tillämpligt)
Skissen täcker komponenter som lagrar eller behandlar data — inte själva modellvikterna i drift. Notera att personuppgifter förekommer på ovanligt många ställen i en LLM-tjänst: inte bara i konversations-DB:n (B.09), utan även i KV-cachen (B.06, RAM), embeddings (B.12, kan delvis inverteras), loggar och spårningsdata (C.03), feedbackloopar tillbaka till träning (B.14 → A.04), och hjälpmodellernas träningsdata. Granskning som bara tittar på kärnmodellen missar därför merparten av angreppsytan.
Terminologi: PD = personuppgifter; PII används här som teknisk detektionskategori för identifierande personuppgifter (t.ex. namn, personnummer, e-post) i pipelines och filter. I löpande text används personuppgifter som huvudbegrepp i linje med GDPR.
Begreppsnyckel
Korta förklaringar av tekniska termer som används på den här sidan och i audit-kravkartan. Termerna är riktade till granskare som behöver förstå arkitekturen utan att vara LLM-specialister.
- Tenant
- Logisk kund- eller organisationsavgränsning i en multi-tenant-tjänst. Tenant-isolering innebär att data, prompter, embeddings, cache och loggar från en kund inte kan nås av en annan — ofta en kritisk kontroll vid molnbaserade LLM-tjänster.
- RAG
- Retrieval-Augmented Generation. Arkitekturmönster där modellen vid varje fråga hämtar relevanta dokument eller dataposter från en kunskapsbas (typiskt en vektor-store) och fogar dem till prompten. Risk: hämtade dokument kan innehålla personuppgifter och kan användas för indirekt prompt injection.
- Embeddings
- Numerisk vektorrepresentation av text eller andra data, framtagen av en modell. Används för semantisk sökning, klustring och RAG. Kan utgöra personuppgifter när de härrör från personuppgifter eller kan kopplas tillbaka till en identifierbar person — särskilt om de kan sökas, jämföras, länkas till konto eller delvis inverteras.
- KV-cache
- Key-Value-cache. Mellanlagring av modellens interna tillstånd (attention-nycklar och -värden) under generering, för att inte räkna om samma kontext flera gånger. Innehåller derivat av prompten — alltså potentiellt personuppgifter — i RAM, oftast kortlivat men ibland delat över requests.
- Prompt-cache
- Cache av tidigare prompter eller delprompter för att snabba upp svar och sänka kostnad. Risk vid återanvändning mellan användare, tenants eller sessioner — kan läcka kontext eller personuppgifter om isolering brister.
- Guardrail
- Policyimplementerande kontroll runt modellen — typiskt en kombination av klassificerare, regler och hjälpmodeller som filtrerar input och output för att förhindra exfiltrering, skadligt innehåll eller policyöverträdelser. Granskas mot designspecifikation och effektivitet (FP/FN).
- Prompt injection
- Angrepp där instruktioner smyger sig in i modellens kontext — antingen direkt (i användarens prompt) eller indirekt (i hämtade dokument, webbsidor eller verktygssvar). Kan användas för att kringgå guardrails, exfiltrera data eller utlösa oavsiktliga verktygsanrop. OWASP LLM01:2025.
- DSR
- Data Subject Request — den registrerades begäran enligt GDPR kapitel III (åtkomst, rättelse, radering, dataportabilitet, invändning m.m.). I LLM-sammanhang kräver DSR-flödet täckning även av embeddings, cache, loggar, träningsdata och feedbackloopar — inte bara den synliga konversationsdatabasen.
- Tool / tool router
- Funktionsanrop som modellen kan utföra (websökning, kodkörning, filsystem, MCP-konnektorer). Tool router väljer och kör verktyget. Granskningspunkter: behörighet, sandbox-isolering, SSRF-skydd, OAuth-scope och loggning av vilka verktyg som körts mot vilken data.
- RLHF / DPO
- Reinforcement Learning from Human Feedback respektive Direct Preference Optimization — träningstekniker som finjusterar modellbeteende utifrån mänskliga preferenser. Annotatordata och feedback-signaler kan innehålla personuppgifter och kräver egen ROPA- och retentionshantering. DPO här är inte detsamma som DPO = dataskyddsombud i löpande text.
- Lineage
- Spårbarhet bakåt från ett dataobjekt eller en modell till dess ursprung — vilka källor, vilken förbehandling, vilka transformationer. Krävs för att kunna svara på radering, rättelse och frågor om laglig grund i hela kedjan.
- Observability
- Samlad insyn i tjänstens drift via loggar, mätetal och spårning. För LLM-tjänster en egen integritetsutmaning eftersom prompter och svar ofta hamnar i observability-stacken med längre retention och bredare åtkomst än applikationen själv.
- Checkpoint
- Sparad version av modellvikterna under eller efter träning. Granskningspunkter: signering, integritet, rollbackförmåga vid incident, åtkomstkontroll.
- Dataförgiftning & modellförgiftning
- Angrepp där tränings-, finjusterings- eller RAG-data manipuleras (dataförgiftning), eller där själva modellvikterna komprometteras via bakdörrar i förtränade modeller, finjusteringar eller adaptrar (modellförgiftning). Kan plantera dolt beteende eller bias som kringgår kontroller. OWASP LLM04:2025 — Data and Model Poisoning.
- Försörjningskedja (AI)
- Kedjan av tredjepartskomponenter en LLM-tjänst vilar på: programvarubibliotek, basmodeller, dataset, adaptrar, modellhubbar och hjälpmodeller. Varje länk kan bära sårbarheter eller komprometterat innehåll. Hanteras med proveniens, signering, sårbarhetshantering och förteckningar (SBOM samt en AI-/modell-BOM). OWASP LLM03:2025 — Supply Chain.
- OWASP LLM Top 10
- Branschvedertagen lista över de tio vanligaste säkerhetsriskerna i LLM-applikationer (version 2025). Refereras på flera ställen i kartan — bl.a. LLM01 prompt injection, LLM02 sensitive information disclosure och LLM10 unbounded consumption.