Mastodawn

xeniax ⏚Jul 24, 2023

О цензуре в генеративных ИИ: интереснейший материал о том почему важно иметь неподцензурные модели и как удалять фильтры из существующих моделей

https://erichartford.com/uncensored-models

Uncensored Models

I am publishing this because many people are asking me how I did it, so I will explain. https://huggingface.co/ehartford/WizardLM-30B-Uncensored https://huggingface.co/ehartford/WizardLM-13B-Uncensored https://huggingface.co/ehartford/WizardLM-7B-Unc...

Cognitive Computations

Show thread

MrClon Jul 25, 2023

@Xeniax а если неподцензурные модели будут говорить слово на букву N, делиться рецептом приготовления крэка и убедительно аргументировать что дело бабы щи рожать? (:

Show thread

xeniax ⏚Jul 25, 2023

@MrClon автор этого текста считает что модели нужны разные, в том числе и такие

Show thread

MrClon

@Xeniax дошли-таки руки прочесть статью. Непривычно базированно, бальзам на душу

«For science and freedom and composability and sexy stories and the lulz»
Этот лозунг мы напишем на наших боевых знамёнах!

Не сказал бы что идея обучать модель на фильтрованном выхлопе ChatGPT меня полностью устраивает, но это лучше чем ничего. Вообще 70к вопросов-ответов (я ведь правильно понял размер дообучающей выборки) это конечно дофига, но не прям ваще дофига. В принципе такой датасет можно набить силами сообщества (у open-assistant.io, опять же если я правильно понял, примерно столько и есть уже)