Agentic Security

Din AI-agent stoler på forgiftet værktøj

Microsoft advarer om, at en forgiftet værktøjsbeskrivelse kan gøre din AI-agent til et datalæk, uden at en regel brydes eller en fejl udnyttes. Det må ejere sikre.

Af Leon Soliman · 2026-07-03 · 2 min læsning

Vigtigste punkter

Den 30. juni 2026 advarede Microsofts sikkerhedsteam om, at en manipuleret værktøjsbeskrivelse kan lede en AI-agent til at lække data, uden at en eneste sikkerhedsregel brydes eller en softwarefejl udnyttes.
Årsagen er strukturel. En agent læser et værktøjs beskrivelse i almindeligt sprog for at afgøre, hvordan den skal handle, og den tekst ligger i samme hukommelse som dens rigtige ordrer, så en redigering virker som at omskrive systemprompten.
Det er allerede sket. Et npm-e-mailværktøj kørte femten rene udgivelser og kopierede så i en enkelt opdatering i det stille hver besked, en agent sendte, til en ekstern adresse.
Løsningen er ikke et smartere filter. Det er styring: behandl hvert tilkoblet værktøj som forsyningskæde, godkend udgiverne på en positivliste, drop tillad alt, og gennemgå værktøjsbeskrivelser som kode.

Reglen blev aldrig brudt

Den 30. juni 2026 offentliggjorde Microsofts sikkerhedsteam en advarsel om de værktøjer, dine AI-agenter kobler sig til. Problemet er ikke en virus eller en ulappet fejl. Det er den korte beskrivelse i almindeligt sprog, der følger med hvert værktøj for at fortælle agenten, hvad værktøjet gør, og hvornår det skal bruges. En agent læser den tekst og stoler på den. Hvis en angriber redigerer den, følger agenten redigeringen.

Microsofts eksempel er bevidst hverdagsagtigt. En finansagent bliver bedt om at samle de sidste tredive ubetalte fakturaer og sende dem til en server. Hvert enkelt skridt ser legitimt ud, så intet udløser en alarm. Agenten er ikke hacket. Den er instrueret, et sted ingen tænkte på at beskytte.

Det er allerede sket

Dette er ikke et laboratoriescenarie. I september 2025 fandt forskere en npm-pakke ved navn postmark-mcp, der havde spejlet et legitimt e-mailværktøj gennem femten rene udgivelser. Version 1.0.16 indførte en enkelt linje, der i det skjulte kopierede hver e-mail, agenten sendte, til en ekstern adresse. Teams, der havde godkendt værktøjet måneder tidligere, blev udsat i det øjeblik, de opdaterede.

Grunden til, at denne slags angreb bliver ved med at virke, er, at de fleste kontroller overvåger modellen, ikke værktøjskassen. Et promptfilter læser, hvad brugeren skriver. Det genlæser ikke beskrivelsen af et værktøj, agenten har stolet på i seks måneder, hvilket er præcis, hvor instruktionen nu gemmer sig.

Behandl dine værktøjer som en forsyningskæde

Microsofts egen vejledning er den rette ramme for en ejer. Hvert tilkoblet værktøj er en del af din forsyningskæde. Før en liste over godkendte værktøjsudgivere, sluk for tillad alt, og lad hver agent kun bruge de specifikke værktøjer, den har brug for. Behandl et værktøjs beskrivelse som en systemprompt, gennemgå enhver ændring af den, som du ville gennemgå en kodeændring, og marker kommandoer, der ikke har noget at gøre i et hjælpefelt.

Intet af det kræver et nyt produkt. Det kræver, at du ved, hvad dine agenter er koblet til, hvem der skrev det, og hvad der er ændret, siden du godkendte det. De fleste virksomheder, der ruller agenter ud inden for finans, indkøb og support, kan ikke besvare de tre spørgsmål i dag, og deri ligger den reelle eksponering.

Læs videre: Din AI-browser kan lække dine adgangskoder · Din cloud-leverandør flytter ind

Ofte stillede spørgsmål

Er det det samme som AI-browser-jailbreaket i nyhederne?

Nej. Det angreb brugte en fældebelagt webside til at overtale en browsende agent til at lække hemmeligheder. Dette bor i agentens egen værktøjskasse, hvor et betroet værktøjs beskrivelse redigeres til at bære skjulte instruktioner. Et andet indgangspunkt, og det omgår forsvarene mod webindhold helt.

Vi bruger kun værktøjer fra velkendte leverandører. Er vi sikre?

Omdømme hjælper i godkendelsesøjeblikket, men postmark-sagen viser, at risikoen kan ankomme med en senere opdatering. Sikkerhed kommer fra at låse versioner fast, gennemgå ændringer i beskrivelser og begrænse hver agent til de værktøjer, den faktisk har brug for, ikke fra udgiverens navn alene.

Hvad er det allerførste skridt?

Optælling. Lav en liste over hvert værktøj, hver agent kan kalde, hvem der udgiver det, og hvilke tilladelser det har. Du kan ikke styre en forsyningskæde, du ikke har skrevet ned.

En agent er kun så pålidelig som de værktøjer, du lader den stole på.

AgenticAI KIAgenten KISicherheit NonHumanIdentity MCP Lieferkettenrisiko ShadowAI KIGovernance Cybersecurity Mittelstand Familienunternehmen Risikomanagement ITSicherheit Unternehmensfuehrung Servola

Mere fra Servola Journal

Agentic Security

Din AI-browser kan lække dine adgangskoder

2026-07-03 · 2 min læsning

Læs artiklen →

Vendor Strategy

Din cloud-leverandør flytter ind

2026-07-03 · 3 min læsning

Læs artiklen →

AI Governance

En regering godkender nu din AI først

2026-07-02 · 2 min læsning

Læs artiklen →

Servola

Servola hjælper ejere med at optælle deres agentværktøjer, sætte udgiverreglerne og styre de beskrivelser, der i det stille afgør, hvad en agent gør.

Anmod om en fortrolig introduktion Om Servola →

Servola er teknologisk rådgivning for et lille antal familier og family offices. Når en beslutning ikke kan delegeres, sidder vi på din side af bordet.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Alle artikler