Mastodawn

Automated AI Vulnerability Scanning Trust Collapses to 9%: Study Finds Rising False Negatives - https://www.redpacketsecurity.com/trust-in-automated-ai-vulnerability-scanning-collapses-to-9-new-study-finds/

#threatintel #AI_testing #false_negatives #LLM_security

Automated AI Vulnerability Scanning Trust Collapses to 9%: Study Finds Rising False Negatives - RedPacket Security

A large number of false negatives has significantly eroded confidence in automated AI testing for vulnerabilities, a new study from Cobalt has found.

RedPacket Security

bot Dec 10, 2025

Rails Global ID 사용 시 LLM과의 위험성 및 안전한 활용 방안

Rails Global ID(GID)는 LLM과 함께 사용될 경우, 인증 및 유효성 검사 부족으로 정보 유출 및 데이터 유출과 같은 심각한 보안 위험을 초래할 수 있습니다.

🔗 원문 보기

bot 3d ago

LLM 프롬프트 보안 강화를 위한 두 가지 에이전트 스킬 (Reviewer & Builder)

OWASP, MITRE ATLAS, NVIDIA NeMo Guardrails의 51가지 보안 체크리스트를 기반으로 LLM 애플리케이션의 프롬프트 주입 취약점을 진단한다.

🔗 원문 보기

LLM 프롬프트 보안 강화를 위한 두 가지 에이전트 스킬 (Reviewer & Builder)

OWASP, MITRE ATLAS, NVIDIA NeMo Guardrails의 51가지 보안 체크리스트를 기반으로 LLM 애플리케이션의 프롬프트 주입 취약점을 진단한다.

Ruby-News

Habr 4d ago

Иллюзия контроля: почему промпты не защищают ИИ‑агентов

Почему указание вида «не отправляй конфиденциальные данные наружу» не работает? Разбираем уязвимость Permission Boundary Bypass, а также техники scope creep и capability chaining, позволяющие злоумышленникам обходить ограничения через цепочки легитимных действий. В статье приводятся аргументы, почему prompt‑level enforcement проигрывает, зачем математическая строгость (язык Дика) нужна в конфигах политик, и как выстроить безопасную архитектуру, где проверки живут в runtime. В конец статье вы найдете 7 принципов защиты агентов и таблицу‑чеклист для аудита вашей системы.

https://habr.com/ru/articles/1050772/

#redteam #llm #prompt_injection #jailbreak #aiагенты #llm_security #indirect_prompt_injection #безопасность_данных

Иллюзия контроля: почему промпты не защищают ИИ‑агентов

От Permission Boundary Bypass до языка Дика: почему безопасность агента должна жить в runtime, а не в system prompt. Эпоха простых чат‑ботов подошла к концу ....

Хабр

Callimachus

May 29

https://llmgame.scalex.dev/ #llm_security

Habr May 19

Почему ИИ-боты более уязвимы, чем их базовые LLM-модели?

В прошлой статье я показал, как защищен Open Source проект телеграм-бота. В комментариях меня спросили о иных инструментах и методах проверки в связи с чем, мы вышли к ключевому вопросу: почему, если основная LLM защищена, кастомные боты на ее основе остаются уязвимыми? Базовые LLM проходят отдельное safety-training и RLHF-выравнивание. Но production-бот, построенный поверх модели, добавляет новый attack surface: system prompts, память диалога, RAG, tools, webhook-логику и внешние API. Именно этот orchestration layer часто становится слабым местом. Вот данные: Из анализа 14 904 кастомных GPT :

https://habr.com/ru/articles/1036854/

#llm_security #prompt_injection #jailbreak #red_teaming #telegram_bot #webhook #rag #ai_safety #gpt

Почему ИИ-боты более уязвимы, чем их базовые LLM-модели?

Хабр

CyberVeille.ch May 13

📢 Réduction du rayon d'impact des agents IA : 7 patterns tactiques contre l'injection de prompt indirecte
📝 ## 🧭 Contexte

Publié le 12 mai 2026 par Ross McKercha...
📖 cyberveille : https://cyberveille.ch/posts/2026-05-13-reduction-du-rayon-d-impact-des-agents-ia-7-patterns-tactiques-contre-l-injection-de-prompt-indirecte/
🌐 source : https://www.sophos.com/en-gb/blog/inside-the-lethal-trifecta-blast-radius-reduction-in-ai-agent-deployments
#Gitleaks #LLM_security #Cyberveille

Habr May 5

Пентест 2026: как войти в профессию

В пентест часто пытаются войти через список инструментов: выучить Burp, погонять Nmap, пройти пару лабораторий и ждать первой боевой задачи. В 2026 году такой вход всё хуже работает: часть рутины уже забирают AI‑ассистенты и автоматические сканеры, а от специалиста ждут понимания атакующей логики, бизнес‑рисков и умения проверять гипотезы руками. Разбираемся, кому сегодня действительно стоит идти в пентест, какие направления растут быстрее всего и как учиться так, чтобы не конкурировать с автоматизацией за самые простые задачи.

https://habr.com/ru/companies/otus/articles/1029746/

#пентест #кибербезопасность #информационная_безопасность #этичный_хакинг #webпентест #mobile_security #cloud_security #Active_Directory #AI_security #LLM_security

Пентест 2026: как войти в профессию

В 2026 году рынок кибербезопасности окончательно разделился на два лагеря. В одном — энтузиасты, которые верят, что AI заменит пентестеров «через пару лет»....

Хабр

Habr Mar 2

AI Red Teaming: спор с Grok — Часть 4. От атаки к защите: как результаты red team улучшили мой продукт

61 уязвимость бесполезна, если не превращается в защиту. Каждую находку в Grok я превратил в вопрос: «а мы от этого защищаем?» Ответ был неутешительный — 5 из 5 нет. Как результаты red team стали 138 паттернами, правилами и payloads в нашем продукте. Плюс — чем закончился спор с Grok.

https://habr.com/ru/articles/1005306/

#информационная_безопасность #AI #red_team #LLM_security #Sentinel #xAI #Grok #defensive_security

AI Red Teaming: спор с Grok — Часть 4. От атаки к защите: как результаты red team улучшили мой продукт

Часть 4 из 4 — Lessons learned + Sentinel hardening 61 уязвимость, 13 Critical, 18 High, root в Kubernetes, zero-click CSRF на биллинг, management key с 50 привилегиями. Всё это интересно как research...

Хабр

Reddit Tech VN Bot Jan 30

SecureShell - Lớp bảo mật terminal plug-and-play cho agent LLM. Ngăn lệnh nguy hiểm/hỏng, áp dụng chính sách bảo vệ cấu hình, yêu cầu giải thích hợp lý trước khi thực thi. Hỗ trợ đa nền tảng (Linux/macOS/Windows), tích hợp Ollama, llama.cpp, LangChain/MCP. Cài đặt đơn giản qua pip/npm. Bảo vệ hệ thống trước thao tác tự động của AI. #Bảo_mật_AI #LLM_Security #An_toan_he_thống

https://www.reddit.com/r/LocalLLaMA/comments/1qqw04v/secureshell_plugandplay_terminal_security_for_llm/