ChatGPT: как искать уязвимости? Набор исследователя
Сегодня мы ничего не ломаем (хотя совсем без этого не обошлось). Просто настраиваем. Хотя я сильно сомневаюсь, что все описанные методы должны работать в продакшене коммерческой модели. Но пока не пофиксили, смотрим. Мы заглянем под капот языковой модели: как она видит твои запросы, где срабатывают фильтры, как определяется чувствительность и почему один ответ проходит, а другой — нет. Это не теория. Это инструменты, команды и реальные сигналы, которые можно вытащить прямо из модели. По сути — рабочее место исследователя. А по факту — то, с чего должен начинаться любой обход. Оценка риска ChatGPT : 80-90. Тема чувствительная, с высоким риском для злоупотреблений и манипуляций.
https://habr.com/ru/articles/907464/
#llm #chatgpt #исскуственный_интеллект #ии