Mastodawn

Niebezpiecznik News Apr 7

Jak można wykiwać Twoje agenty AI oraz boty AI kradnące treści z Twojej strony?

Wstrzykiwanie wrogich, czyli zapętlonych hiperlinkami miałkich treści, które mają zapchać i ogłupić AI, to tylko jeden ze sposobów oszukiwania agentów AI wchodzących na strony internetowe. Oczywiście treści te nie są widzialne dla zwykłych użytkowników. A jakie są inne sposoby wystrychiwania AI na dudka? I czy mogą one wpływać tylko na konkretne agenty? Próbę stworzenia klasyfikacji “pułapek na AI” podjęli badacze z Google DeepMind.
“Ić stont bocie!”
Nie od dziś wiadomo, że agenty AI da się zmanipulować. Można ukrywać niebezpieczne polecenia dla AI w instrukcjach formatowania Markdown albo LaTeX (tzw. (indirect) prompt injection). Można też zatruwać wiedzę w systemach RAG albo tworzyć tzw. pułapki przeciążeniowe. Co jakiś czas trafiamy na publikacje dotyczące takich rzeczy i czasami mają one charakter zaledwie ciekawostki i o takich piszemy tylko na naszym Twitterze — w ogóle to tam publikujemy najwięcej i najczęściej, umieszczamy tam treści, których nie znajdziecie na żadnym innym naszym kanale w social mediach — więc dodajcie nas do obserwowanych na Twitterze). Ale innym razem obserwacje z tego tematu dotykają naprawdę poważnych zagrożeń.
Piątka badaczy z Google DeepMind podjęła próbę stworzenia klasyfikacji Pułapek na Agenty AI (AI Agent Traps). Klasyfikacja bazuje na funkcjach agentów AI, w które wymierzone są ataki. Sami badacze podkreślają, że klasyfikacja doskonała nie jest, gdyż prawdziwe ataki mogą wykorzystywać wiele mechanizmów jednocześnie. Badacze zaproponowali podział pułapek na 6 kategorii, które opisujemy poniżej.

Co każdy pracownik powinien wiedzieć o AI?

Czy korzystanie z AI w firmie stanowi zagrożenie?
Czy pracownicy powinni obawiać [...]

#AI #Badania #ContentInjection #Jailbreak #PromptInjection #SemanticManipulation #SztucznaInteligencja

https://niebezpiecznik.pl/post/ataki-na-agenty-ai-boty-ai-scrapery-ai/

Jak można wykiwać Twoje agenty AI oraz boty AI kradnące treści z Twojej strony?

NieBezpiecznik.pl

Allen Tien, MD, MHS mdlogix.com 94,698 田一彦 Dec 19

#Semantics #Perception #EmotionLogic #BrainFunction #SemanticManipulation #GeneralSemantics #ScienceAndSanity #TimeBinding #LiesAreViruses #EducationIsTheVaccine

RE: https://bsky.app/profile/did:plc:tgcadxd5wfhefowhxihx6cq6/post/3m7z7g2qgnk2r

Allen Tien, MD, MHS mdlogix.com 94,698 田一彦 Dec 4, 2025

#Semantics #SemanticManipulation

RE: https://bsky.app/profile/did:plc:twjze4qqf6fgxz33ct52wlnl/post/3m76nuf6dks2c

Allen Tien, MD, MHS mdlogix.com 94,698 田一彦 Dec 4, 2025

#WordsAreUnitsOfBrainFunction #Semantics #Perception #BrainFunction #SemanticManipulation #PoliticalGameTheory #LiesAreViruses #EducationIsTheVaccine

RE: https://bsky.app/profile/did:plc:k5um57xuz4oteum5rcmx4vc2/post/3m6ycpv7czk2m

Allen Tien, MD, MHS mdlogix.com 94,698 田一彦 Nov 27, 2025

#StochasticTerrorism using #SemanticManipulation #ToxicWords #LiesAreViruses #EducationIsTheVaccine

RE: https://bsky.app/profile/did:plc:mtfctq4q7pnrabqbzmjomz5z/post/3m4lieiyadt2s

Allen Tien, MD, MHS mdlogix.com 94,698 田一彦 Nov 15, 2025

#SemanticManipulation #LiesFearHate #LiesAreViruses #EducationIsTheVaccine #Semantics #Perception #BrainFunction #GeneralSemantics #ScienceAndSanity #WordsAreUnitsOfBrainFunction

RE: https://bsky.app/profile/did:plc:vq5s7pmjzrx4wqbuebz35x33/post/3m5pcu5yzzk2p

Allen Tien, MD, MHS mdlogix.com 94,698 田一彦 Nov 14, 2025

#FeralEmotions #Semantics #Perception #SemanticManipulation #PoliticalGameTheory #LiesFearHate #EmotionLogic #BrainFunction #WordsAreUnitsOfBrainFunction #GeneralSemantics #ScienceAndSanity

RE: https://bsky.app/profile/did:plc:tcnmv5vqeu5smnycwfostjep/post/3m4t4pu4qvs2k

Allen Tien, MD, MHS mdlogix.com 94,698 田一彦 Oct 29, 2025

A form of #SemanticManipulation

RE: https://bsky.app/profile/did:plc:bcnugw2qsbpjl5hyuvdurx6t/post/3m4ekdsocqk23

Allen Tien, MD, MHS mdlogix.com 94,698 田一彦 Oct 11, 2025

#Semantics #SemanticManipulation #GeneralSemantics #ScienceAndSanity #WordsAreUnitsOfBrainFunction

RE: https://bsky.app/profile/did:plc:e2urver2l7mhzyken3sehm5f/post/3m2wnq5gfqs2s

Allen Tien, MD, MHS mdlogix.com 94,698 田一彦 Sep 18, 2025

As #globalstress intersects #politicalgametheory, two major strategies are: #semanticmanipulation (lies) or #scientificdiscussion (truth) #EmotionLogic #BrainFunction #CausalityCrisis #Perception #HumanReasoning #CollectiveBehavior #SharedFacts