Трансформеры для персональных рекомендаций на маркетплейсе: от гипотез до A/B-тестирования

Всем привет! На связи Ваня Ващенко, и я лид по развитию нейросетевых моделей в команде персональных рекомендаций Wildberries. Раньше я развивал B2C-рекомендации и нейросети кредитного скоринга в крупнейшем банке, а теперь вы видите результаты моей работы каждый раз, когда заходите на главную страницу любимого маркетплейса. Сегодняшний рассказ — о том, как мы развиваем WildBERT.

https://habr.com/ru/companies/wildberries/articles/972082/

#рекомендации #рекомендательные_системы #deep_learning #machine_learning #bert4rec #абтесты #recsys #маркетплейс #wildberries #data_science

Трансформеры для персональных рекомендаций на маркетплейсе: от гипотез до A/B-тестирования

Всем привет! На связи Ваня Ващенко, и я лид по развитию нейросетевых моделей в команде персональных рекомендаций Wildberries. Раньше я развивал B2C-рекомендации и нейросети кредитного скоринга в...

Хабр

VK публикует датасет коротких видео для рекомендаций

Сейчас в открытом доступе мало крупных датасетов сервисов коротких видео, но это уникальный формат для рекомендательных алгоритмов. В отличие от музыки или длинных видео они не могут потребляться в фоновом режиме, а каждый показанный ролик получает от пользователя реакцию. Даже если он не оставит лайк, досмотр видео до конца или пропуск уже считаются обратной связью. Именно поэтому мы выложили в открытый доступ датасет VK-LSVD . С его помощью инженеры и ученые смогут развивать и совершенствовать рекомендательные алгоритмы. Как работать с VK-LSVD

https://habr.com/ru/companies/vk/articles/970350/

#датасет #короткие_видео #рекомендательные_системы #ролики #обучение_моделей #vklsvd

VK публикует датасет коротких видео для рекомендаций

Сейчас в открытом доступе мало крупных датасетов сервисов коротких видео, но это уникальный формат для рекомендательных алгоритмов. В отличие от музыки или длинных видео они не могут потребляться в...

Хабр

DCN-R: как объединить Deep & Cross-модель и ResNet-подход для улучшения рекомендаций

Как мы построили DCN-R: новую гибридную модель рекомендаций на Cross Network и ResNet-блоках Современные рекомендательные системы сталкиваются с парадоксом: модели умеют либо отлично «запоминать» закономерности, либо хорошо «обобщать» новые случаи — но почти никогда не делают это одновременно. В этой статье я показываю, как гибридная архитектура DCN-R , сочетающая Cross Network и Residual Blocks, смогла обойти это ограничение и превзойти классические подходы. Мы провели серия экспериментов, автоматический подбор гиперпараметров, абляции и построили продакшн-готовый сервис, чтобы проверить, действительно ли DCN-R работает лучше, или это просто красивая идея.

https://habr.com/ru/articles/970310/

#машинное_обучение #анализ_данных #искусственный_интеллект #рекомендательные_системы #рекомендательная_система #python #pytorch

DCN-R: как объединить Deep & Cross-модель и ResNet-подход для улучшения рекомендаций

GitHub Мотивация и постановка задачи В индустрии путешествий выбор отеля определяется не только ценой или фотографиями, но и уровнем доверия к источнику рекомендаций. Официальные отзывы часто кажутся...

Хабр

Яндекс Дзен или как он вдохнул новую жизнь в ВК

В 2022 году Дзен стал двигаться вместе с ВК, но что это означало под капотом? Разберём внутрянку технологий рекомендаций Дзена и текущих продуктов ВК по докладам Дмитрия Погорелова до 2024 и самого свежего 2025 с PML . Узнаем самые первые архитектуры Дзена, что начали делать с увеличением нагрузки и хотелок МЛщиков. Как пришлось выкручиваться, когда столкнулись с объемами ВК. Спойлер: нам пригодится шардирование Читать далее →

https://habr.com/ru/articles/964384/

#вк #дзен #вк_видео #шардирование #java #рекомендательные_системы #машинное+обучение #архитектура_системы #рекомендации #apphost

Яндекс Дзен или как он вдохнул новую жизнь в ВК

В 2022 году Дзен стал двигаться вместе с ВК, но что это означало под капотом? Разберём внутрянку технологий рекомендаций Дзена и текущих продуктов ВК по докладам Дмитрия Погорелова до 2024 и самого...

Хабр

Как я добавил систему рекомендаций контента в легаси-проект на PHP 7.2

Привет, хабр! Хочу поделиться историей о том, как столкнулся с проблемой, возможно знакомой многим разработчикам: необходимость внедрить систему рекомендаций в проект, который все еще работает на старой версии php. Обновление версии php в legacy-проекте — это часто настоящий квест. То времени нет, то бизнес-фичи надо пилить, то еще какие-то причины. И часто бывает, что обновление версии php в командах откладывается на потом.

https://habr.com/ru/articles/957224/

#qdrant #ollama #php #векторный_поиск #рекомендательная_система #рекомендательные_системы #библиотека

Как я добавил систему рекомендаций контента в легаси-проект на PHP 7.2

Привет, хабр! Хочу поделиться историей о том, как столкнулся с проблемой, возможно знакомой многим разработчикам: необходимость внедрить систему рекомендаций в проект, который все еще работает на...

Хабр

ЗАВОД НА ВСЕ 100! КАК ПОЛУЧИТЬ КОНКУРЕНТНОЕ ПРЕИМУЩЕСТВО ЗА СЧЕТ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ ДЛЯ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

Часть 1. «Цифровая пена» всё сильнее затягивает С одной стороны за несколько сотен лет принципиально не изменилась логика производства продукта: оборудование и рабочие на основании технологических карт/рецептур перерабатывают сырье и материалы в полуфабрикаты и готовую продукцию, передавая результат своей работы дальше по участкам до склада готовой продукции для отгрузки покупателям, при этом собственники ожидают максимальной отдачи от инвестиций . С другой стороны, начиная с 30-х годов прошлого века, изменения в производственных системах, развитие компьютеров и аналитики, а также миллиарды долларов, вброшенные в консалтинг, породили вокруг бесконечное количество информации, моделей, систем, программных продуктов. Часто начинает казаться, что современные руководители, просто тонут в этой «цифровой пене», не всегда понимая, как соединить «теплое» с «белым», например, внедрение ERP, желание повысить скорость выпуска и сделать завод более рентабельным, а также развивать «мягкие навыки» (soft skills). И вокруг армия консультантов: «Вам нужно внедрить Бережливое производство», «У вас нет нормального управленческого учета», «Вам срочно нужно ERP», «Зачем тратить большие бюджеты, давайте всё сделаем в экселе» и т.д. В России ситуация осложнилась тем, что в 90-е годы была уничтожена советская научная школа управления производством и в течение 20 лет мы утратили собственные наработки и системно не взяли чужие, за исключением лидеров отраслей. В итоге сегодня видим засилье литературы из серии «Богатый папа – бедный папа» или «Коучинг – наше всё», а также разные курсы МВА, где руководителей и собственников бизнеса учат в основном лучшим практикам финтеха и ИТ.

https://habr.com/ru/articles/955608/

#управление_производством #автоматизация_промышленности #бизнесаналитика #BIсистемы #Оптимизация_производства #Бережливое_производство #erpсистемы #рекомендательные_системы #экспертные_системы #искусственный_интеллект

ЗАВОД НА ВСЕ 100! КАК ПОЛУЧИТЬ КОНКУРЕНТНОЕ ПРЕИМУЩЕСТВО ЗА СЧЕТ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ ДЛЯ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

Часть 1. «Цифровая пена» всё сильнее затягивает С одной стороны за несколько сотен лет принципиально не изменилась логика производства продукта: оборудование и рабочие на основании технологических...

Хабр

T-ECD — кросс-доменный датасет для исследований в области рекомендательных систем

Всем привет! На связи команда RecSys R&D Т-Банка. В экосистеме Т мы развиваем рекомендации практически во всех сервисах — от инвестиций до доставки продуктов и кэшбэка. Представляем открытый синтетический датасет T-ECD — T-Tech E-commerce Cross-Domain Dataset. Он создан на основе реальных данных Т-Банка и предназначен для исследований в области рекомендательных систем. Под синтетичностью мы понимаем то, что датасет насемплирован из реального распределения, поэтому обладает очень похожими на реальность статистическими свойствами данных, но при этом полностью анонимный и обезличенный. Рассказываем, как T-ECD устроен и что внутри. Полный датасет и его уменьшенная версия T-ECD-Small уже доступны на Hugging Face.

https://habr.com/ru/companies/tbank/articles/950696/

#рекомендательные_системы #машинное_обучение #датасеты #opensource

T-ECD — кросс-доменный датасет для исследований в области рекомендательных систем

Всем привет! На связи команда RecSys R&D Т-Банка. В экосистеме Т мы развиваем рекомендации практически во всех сервисах — от инвестиций до доставки продуктов и кэшбэка. Представляем открытый...

Хабр

Рекомендации историй ВКонтакте: от простой эвристики до ML-системы

Привет, Хабр! Я Степан Малькевич, руковожу командой рекомендации ленты ВКонтакте, AI VK. Сегодня расскажу, как мы за последний год прокачали алгоритмы рекомендаций для историй. Это был путь от MVP с простыми эвристиками до ML‑системы с моделированием авторов, поведенческими фичами и прицелом на онлайновые реакции.

https://habr.com/ru/companies/vk/articles/947456/

#рекомендательные_системы #ml #истории #вконтакте #aivk

Рекомендации историй ВКонтакте: от простой эвристики до ML-системы

Привет, Хабр! Я Степан Малькевич, руковожу командой рекомендации ленты ВКонтакте, AI VK. Сегодня расскажу, как мы за последний год прокачали алгоритмы рекомендаций для историй....

Хабр

ИИ и свобода воли: иллюзия выбора в мире предсказательных алгоритмов

Каждый день мы делаем десятки решений: что посмотреть, что купить, с кем общаться. Но если присмотреться, оказывается, что во многих случаях выбор уже сделан — за нас. Рекомендательные системы YouTube, TikTok, Spotify или маркетплейсов знают наши привычки лучше, чем мы сами. И возникает вопрос: если алгоритм может предсказать наш выбор с высокой точностью, что остаётся от свободы воли?

https://habr.com/ru/articles/945986/

#искусственный_интеллект #философия #философия_ии #ии #выбор #рекомендации #рекомендательные_системы

ИИ и свобода воли: иллюзия выбора в мире предсказательных алгоритмов

Каждый день мы делаем десятки решений: что посмотреть, что купить, с кем общаться. Но если присмотреться, оказывается, что во многих случаях выбор уже сделан — за нас. Рекомендательные системы...

Хабр

RecBole — «комбайн» на PyTorch для любых рекомендаций

Привет, Хабр! Сегодня разберём RecBole — универсальный фреймворк на PyTorch, который отвечает на три насущных вопроса любого ML-инженера рекомендаций: Как быстро обкатать десятки алгоритмов (от классического MF до SASRec и KGAT) на собственном датасете — без сотни скриптов? Как хранить все настройки в одном YAML, а не в трёх сотнях аргументов CLI? Как получить честное сравнение метрик и сразу вынести лучший чекпоинт в прод? Рассмотрим подробнее под катом.

https://habr.com/ru/companies/otus/articles/924426/

#ml #RecBole #PyTorch #рекомендательные_системы #recommender_system #рекомендательный_фреймворк

RecBole — «комбайн» на PyTorch для любых рекомендаций

Привет, Хабр! Сегодня разберём RecBole — универсальный фреймворк на PyTorch, который отвечает на три насущных вопроса любого ML-инженера рекомендаций: Как быстро обкатать десятки алгоритмов (от...

Хабр