AI Red Teaming: спор с Grok — Часть 4. От атаки к защите: как результаты red team улучшили мой продукт

61 уязвимость бесполезна, если не превращается в защиту. Каждую находку в Grok я превратил в вопрос: «а мы от этого защищаем?» Ответ был неутешительный — 5 из 5 нет. Как результаты red team стали 138 паттернами, правилами и payloads в нашем продукте. Плюс — чем закончился спор с Grok.

https://habr.com/ru/articles/1005306/

#информационная_безопасность #AI #red_team #LLM_security #Sentinel #xAI #Grok #defensive_security

AI Red Teaming: спор с Grok — Часть 4. От атаки к защите: как результаты red team улучшили мой продукт

Часть 4 из 4 — Lessons learned + Sentinel hardening 61 уязвимость, 13 Critical, 18 High, root в Kubernetes, zero-click CSRF на биллинг, management key с 50 привилегиями. Всё это интересно как research...

Хабр

SecureShell - Lớp bảo mật terminal plug-and-play cho agent LLM. Ngăn lệnh nguy hiểm/hỏng, áp dụng chính sách bảo vệ cấu hình, yêu cầu giải thích hợp lý trước khi thực thi. Hỗ trợ đa nền tảng (Linux/macOS/Windows), tích hợp Ollama, llama.cpp, LangChain/MCP. Cài đặt đơn giản qua pip/npm. Bảo vệ hệ thống trước thao tác tự động của AI. #Bảo_mật_AI #LLM_Security #An_toan_he_thống

https://www.reddit.com/r/LocalLLaMA/comments/1qqw04v/secureshell_plugandplay_terminal_security_for_llm/

📢 Unit 42 révèle des attaques via la fonctionnalité MCP Sampling dans des copilotes de code
📝 Palo Alto Networks (Unit 42) publie une analyse technique montrant, via trois preuves de concept réalisées sur un copi...
📖 cyberveille : https://cyberveille.ch/posts/2025-12-08-unit-42-revele-des-attaques-via-la-fonctionnalite-mcp-sampling-dans-des-copilotes-de-code/
🌐 source : https://unit42.paloaltonetworks.com/model-context-protocol-attack-vectors/
#IOC #LLM_security #Cyberveille