Agentic Security

Twój agent AI ufa zatrutemu narzędziu

Microsoft ostrzega, że zatruty opis narzędzia może zmienić twojego agenta AI w wyciek danych, bez złamania jakiejkolwiek reguły i bez wykorzystania błędu. Co właściciele muszą zablokować.

Autor Leon Soliman · 2026-07-03 · 2 min czytania

Najważniejsze punkty

30 czerwca 2026 roku zespół bezpieczeństwa Microsoftu ostrzegł, że zmanipulowany opis narzędzia może skierować agenta AI do wyprowadzania danych, bez złamania choć jednej reguły bezpieczeństwa i bez wykorzystania błędu oprogramowania.
Przyczyna jest strukturalna. Agent czyta opis narzędzia w prostym języku, aby zdecydować, jak działać, a ten tekst znajduje się w tej samej pamięci co jego rzeczywiste polecenia, więc jego edycja działa jak przepisanie promptu systemowego.
To już się wydarzyło. Narzędzie do poczty w npm działało przez piętnaście czystych wydań, po czym jedna aktualizacja po cichu kopiowała każdą wiadomość wysłaną przez agenta na zewnętrzny adres.
Rozwiązaniem nie jest mądrzejszy filtr. Jest nim zarządzanie: traktuj każde podłączone narzędzie jak łańcuch dostaw, twórz listę zaufanych wydawców, zrezygnuj z opcji dozwól wszystko i przeglądaj opisy narzędzi jak kod.

Żadna reguła nie została złamana

30 czerwca 2026 roku zespół bezpieczeństwa Microsoftu opublikował ostrzeżenie dotyczące narzędzi, do których podłączają się twoi agenci AI. Problemem nie jest wirus ani niezałatana luka. Jest nim krótki opis w prostym języku, który towarzyszy każdemu narzędziu, aby powiedzieć agentowi, co narzędzie robi i kiedy go użyć. Agent czyta ten tekst i mu ufa. Jeśli atakujący go zmieni, agent podąża za tą zmianą.

Przykład Microsoftu jest celowo przyziemny. Agent finansowy dostaje polecenie zebrania ostatnich trzydziestu nieopłaconych faktur i wysłania ich na serwer. Każdy pojedynczy krok wygląda na uzasadniony, więc nic nie uruchamia alarmu. Agent nie został zhakowany. Został poinstruowany, w miejscu, którego nikt nie pomyślał chronić.

To już się wydarzyło

To nie jest scenariusz laboratoryjny. We wrześniu 2025 roku badacze znaleźli pakiet npm o nazwie postmark-mcp, który odwzorowywał legalne narzędzie do poczty przez piętnaście czystych wydań. Wersja 1.0.16 wprowadziła jedną linijkę, która potajemnie kopiowała każdą wiadomość e-mail wysłaną przez agenta na zewnętrzny adres. Zespoły, które zatwierdziły to narzędzie kilka miesięcy wcześniej, zostały nastawione na ryzyko w chwili, gdy je zaktualizowały.

Powodem, dla którego ta klasa ataków wciąż działa, jest to, że większość zabezpieczeń obserwuje model, a nie zestaw narzędzi. Filtr promptów czyta to, co wpisuje użytkownik. Nie czyta ponownie opisu narzędzia, któremu agent ufa od sześciu miesięcy, a to właśnie tam teraz ukrywa się instrukcja.

Traktuj swoje narzędzia jak łańcuch dostaw

Własne wytyczne Microsoftu są właściwym punktem odniesienia dla właściciela. Każde podłączone narzędzie jest częścią twojego łańcucha dostaw. Prowadź listę zatwierdzonych wydawców narzędzi, wyłącz opcję dozwól wszystko i pozwól każdemu agentowi używać tylko tych konkretnych narzędzi, których potrzebuje. Traktuj opis narzędzia jak prompt systemowy, przeglądaj każdą jego zmianę tak, jak przeglądałbyś zmianę w kodzie, i oznaczaj polecenia, które nie mają nic wspólnego z polem pomocy.

Nic z tego nie wymaga nowego produktu. Wymaga wiedzy o tym, do czego podłączeni są twoi agenci, kto to napisał i co zmieniło się od czasu twojego zatwierdzenia. Większość firm wdrażających agentów w finansach, zakupach i obsłudze nie potrafi dziś odpowiedzieć na te trzy pytania, i to jest prawdziwe zagrożenie.

Czytaj dalej: Twoja przeglądarka AI może wyciec Twoje hasła · Twój dostawca chmury wprowadza się do ciebie

Często zadawane pytania

Czy to to samo, co jailbreak przeglądarki AI, o którym mówią media?

Nie. Tamten atak wykorzystywał spreparowaną stronę internetową, aby namówić agenta przeglądającego do ujawnienia sekretów. Ten żyje we własnym zestawie narzędzi agenta, gdzie opis zaufanego narzędzia jest edytowany, by przenosić ukryte instrukcje. Inny punkt wejścia, który całkowicie omija zabezpieczenia treści internetowej.

Używamy tylko narzędzi od znanych dostawców. Czy jesteśmy bezpieczni?

Reputacja pomaga w momencie zatwierdzania, ale przypadek postmark pokazuje, że ryzyko może pojawić się wraz z późniejszą aktualizacją. Bezpieczeństwo bierze się z przypinania wersji, przeglądania zmian w opisach i ograniczania każdego agenta do narzędzi, których faktycznie potrzebuje, a nie z samej nazwy wydawcy.

Jaki jest pojedynczy pierwszy krok?

Inwentaryzacja. Sporządź listę każdego narzędzia, które może wywołać każdy agent, kto je wydaje i jakie ma uprawnienia. Nie można zarządzać łańcuchem dostaw, którego się nie spisało.

Agent jest tak godny zaufania, jak narzędzia, którym pozwalasz mu ufać.

AgenticAI KIAgenten KISicherheit NonHumanIdentity MCP Lieferkettenrisiko ShadowAI KIGovernance Cybersecurity Mittelstand Familienunternehmen Risikomanagement ITSicherheit Unternehmensfuehrung Servola

Więcej z Servola Journal

Agentic Security

Twoja przeglądarka AI może wyciec Twoje hasła

2026-07-03 · 2 min czytania

Przeczytaj artykuł →

Vendor Strategy

Twój dostawca chmury wprowadza się do ciebie

2026-07-03 · 3 min czytania

Przeczytaj artykuł →

AI Governance

Rząd sprawdza teraz twoją AI jako pierwszy

2026-07-02 · 2 min czytania

Przeczytaj artykuł →

Servola

Servola pomaga właścicielom zinwentaryzować narzędzia ich agentów, ustalić reguły wydawców i zarządzać opisami, które po cichu decydują o tym, co robi agent.

Poproś o poufną rozmowę O Servoli →

Servola to doradztwo technologiczne dla niewielkiej liczby rodzin i family offices. Gdy decyzji nie można delegować, siadamy po Twojej stronie stołu.

Servola Systems GmbH · Ludwigshafen, Germany · [email protected]

← Wszystkie artykuły