Как дообучить LLM. Рассказываю шаг за шагом

В этой статье я шаг за шагом расскажу, как дообучить LLM под свою задачу. В качестве примера возьму open-source модель Qwen2.5-0.5B и дообучу её извлекать информацию из текста в формате JSON по заданной схеме. Сначала дам короткую вводную по этапам обучения языковых моделей, а затем перейдём к практике: подготовим данные, настроим LoRA, обучим модель в Colab и сравним метрики до и после — заодно проверим, насколько сильно модель забывает прежние знания. Рассказ будет сопровождаться кодом на Python. 🔥 Начинаем 🔥

https://habr.com/ru/articles/1044422/

#SFT #LoRA #finetuning #LLM #qwen #дообучение_llm

Как дообучить LLM. Рассказываю шаг за шагом

Всем привет, меня зовут Максимов Максим. Я Team Lead в R&D-лаборатории компании red_mad_robot и автор  Telegram‑канала Максим Максимов // IT, AI . Сегодня мы погрузимся в тему дообучения...

Хабр