Одна строка — много объектов: как агрегировать эмбеддинги для ML-моделей

Иногда одна строка датасета соответствует не одному объекту, а целому набору связанных объектов: новостям, комментариям, изображениям или событиям. Каждый из них можно превратить в эмбеддинг, но модель обычно ждет фиксированный набор признаков. В статье разбираю, как с этим работать на практике: от простых агрегатов и pooling до MIL, LLM‑разметки и гибридных подходов.

https://habr.com/ru/articles/1043764/

#машинное_обучение #искусственный_интеллект #эмбеддинги #агрегация #MIL #llm #feature_engineering #pooling #attention #NLP

Одна строка — много объектов: как агрегировать эмбеддинги для ML-моделей

Коротко Иногда в задаче машинного обучения одна строка датасета соответствует не одному объекту, а целому набору связанных объектов. Например: день по акции -> много новостей пользователь ->...

Хабр