О цензуре в генеративных ИИ: интереснейший материал о том почему важно иметь неподцензурные модели и как удалять фильтры из существующих моделей

https://erichartford.com/uncensored-models

Uncensored Models

I am publishing this because many people are asking me how I did it, so I will explain. https://huggingface.co/ehartford/WizardLM-30B-Uncensored https://huggingface.co/ehartford/WizardLM-13B-Uncensored https://huggingface.co/ehartford/WizardLM-7B-Unc...

Cognitive Computations
@Xeniax а если неподцензурные модели будут говорить слово на букву N, делиться рецептом приготовления крэка и убедительно аргументировать что дело бабы щи рожать? (:
@MrClon автор этого текста считает что модели нужны разные, в том числе и такие

@Xeniax дошли-таки руки прочесть статью. Непривычно базированно, бальзам на душу

«For science and freedom and composability and sexy stories and the lulz»
Этот лозунг мы напишем на наших боевых знамёнах!

Не сказал бы что идея обучать модель на фильтрованном выхлопе ChatGPT меня полностью устраивает, но это лучше чем ничего. Вообще 70к вопросов-ответов (я ведь правильно понял размер дообучающей выборки) это конечно дофига, но не прям ваще дофига. В принципе такой датасет можно набить силами сообщества (у open-assistant.io, опять же если я правильно понял, примерно столько и есть уже)