Как датасайентисту выжимать максимум пользы из фотографий

Привет! Я Сергей Кляхандлер, техлид в команде LLM Авито . В 2024 году мы разработали и выпустили ML-модель, которая автоматически генерирует описания для объявлений из категории Одежда и обувь. В этом году автогенерацию усовершенствовали, а подход переиспользовали. Теперь мы можем создавать дополнительные ключевые слова для поиска. Статья будет полезна DS-инженерам, которые работают с мультимодальными LLM-моделями.

https://habr.com/ru/companies/avito/articles/936348/

#авито #llmмодели #ai #искуственный_интеллект #автогенерация

Как датасайентисту выжимать максимум пользы из фотографий

Привет! Я Сергей Кляхандлер, техлид в команде LLM Авито . В 2024 году мы разработали и выпустили ML-модель, которая автоматически генерирует описания для объявлений из категории «Одежда...

Хабр

Проблема (не) в ИИ?

Страх окружающих заключается в том, что ИИ сделает творчество ненужным. Но реальность ровно обратная. Когда генерация "чего-угодно" становится тривиальной, ценность осмысленного, отточенного и прочувствованного произведения взлетает до небес. Теперь это значит только одно — оправданий больше нет. Отсидеться не получится. Не бойтесь, что ИИ убьет творчество. Бойтесь мира, в котором правила его использования и этику его применения напишут те, кто в творчестве ничего не понимает, пока вы стояли в стороне. Раньше можно было сказать “у меня нет возможности, чтобы воплотить идею”, теперь единственный честный ответ — “у меня нет идеи, достойной воплощения”. Читать далее 👀

https://habr.com/ru/articles/936426/

#искуственный_интеллект #ии #геймдизайн #геймдизайнер #обсуждение #системы #разгон

Проблема (не) в ИИ?

«Разгон» — авторский формат моего  ТГК , в котором я НЕ стремлюсь давать исчерпывающие ответы или окончательные выводы. Это способ структурирования собственных мыслей вслух, упорядочивания и...

Хабр

Как мы искали лучшие AI-модели (Часть 3)

В предыдущих статьях мы описали начало нашего пути тестирования AI моделей на предмет определения лучших и описали основные метрики, с помощью которых можно проводить такой анализ. В этом тексте приведен список найденных метрик для более детального и глубокого рассмотрения качества работы AI, а также результаты тестирования моделей по выбранным ранее метрикам. Составляя этот материал, мы хотели поделиться своим опытом использования различных метрик для оценки ответов AI моделей. Для тех из них, которые мы не смогли полноценно использовать в ходе своих исследований, мы подготовили описание с практическими примерами.

https://habr.com/ru/articles/935408/

#искусственный_интеллект #тестирование #искуственный_интеллект

Как мы искали лучшие AI-модели (Часть 3)

В предыдущих статьях мы описали начало нашего пути тестирования AI моделей на предмет определения лучших и описали основные метрики, с помощью которых можно проводить такой анализ. В этом тексте...

Хабр

Дизайн в качестве основы детской литературы

Авторские изображения и минимум текста — так выглядят современные детские книги на Западе. Времена фантазии все больше остаются в прошлом, уступая место современным технологиям. К сожалению, с этим ничего нельзя сделать, поскольку альтернативу в России предложить некому, да и нечем. Поэтому постепенно тренд завоёвывает и российский рынок. С одной стороны, в этом можно отыскать и положительную сторону. Современные художники предлагают оригинальные идеи для дизайна детских кинг. Высокая конкуренция заставляет искать новые области для творчества, порою граничащие со скандалом , особенно если дело касается детей. Более того, авторский дизайн ярко выделяется на фоне засилия ИИ-изображений, что буквально бросается в глаза при просмотре любого онлайн-каталога детских книг. Это помогает сегрегировать качественную детскую литературу и поддерживать стандарт продукции. С другой стороны, высокая планка, а заодно и стоимость, дизайна детской книги часто идёт в ущерб его содержанию. Текст уходит на второе место, если в принципе ещё необходим автору для каких-то совсем прозаических целей. Однако в этом моменте следует отметить ключевую деталь: детские книги теряют свою историческую роль воспитания, становясь объектом развлечения . Теперь самое время оглянуться на историю детской литературы. Думаю, ни для кого не секрет, что большую часть существования цивилизации детский фольклор передавался исключительно в устной форме. Впрочем, как и любой другой до широкого распространения книгопечатания и легкого доступа к книгам практически для всех слоёв населения. В XIX веке в России стали предпринимать первые попытки систематизации русского фольклора, в том числе и детского. Ярким примером тому служит появление сборника сказок А.Н. Афанасьева, опубликованного в 1855-1863 гг. Впоследствии к вопросу систематизации сотен детских сказок русского народа обращался и Максим Горький, и всем нам хорошо известный В.Я. Пропп в своей книге «Исторические корни волшебной сказки». Вернёмся к устной форме. Стоит выделить два очень важных момента для темы данной статьи. Во-первых, как вы сами понимаете, ребёнку требовалась фантазия для того, чтобы представлять образы фольклора. Полностью детские книги, а уж тем более с иллюстрациями, появятся лишь к концу XIX века. Кстати, кому любопытно, как выглядели такие европейские детские книги, есть бесплатная коллекция литературы на сайте университета Флориды. Во-вторых, детский фольклор нёс в первую очередь в себе воспитательную роль ( как нужно поступать, чтобы выжить, что является добром ) и бытовую роль ( для укачивания ребенка перед сном, к примеру ). Равзлечение было скорее сопутствующим фактором, чем запланированным. И если вы вспомните оригинальные сюжеты сказок ( Гримм, например ), то поймёте, про что идёт речь.

https://habr.com/ru/articles/935654/

#дизайн #контент #литература #искуственный_интеллект #история #дети #детство #издательство

Дизайн в качестве основы детской литературы

Авторские изображения и минимум текста — так выглядят современные детские книги на Западе. Времена фантазии все больше остаются в прошлом, уступая место современным технологиям. К сожалению, с этим...

Хабр

GPT-5: Технологический прорыв, который трансформирует профессии

7 августа 2025 года OpenAI представила GPT-5 — свою самую мощную на сегодняшний день языковую модель. Новая версия ИИ не просто эволюция GPT-4.5 или GPT-4o, а новый класс ИИ, который приблизил технологии к порогу AGI (Artificial General Intelligence — обобщённого интеллекта). Кратко: что нового в GPT-5?

https://habr.com/ru/articles/935180/

#искуственный_интеллект #GPT5 #openai #Сравнение_GPT45_и_GPT5 #Будущее_профессий #автоматизация_труда #цифровая_трансформация #ии_в_бизнесе #влияние_на_рынок_труда #нейросеть_нового_поколения

GPT-5: Технологический прорыв, который трансформирует профессии

GPT-5 7 августа 2025 года OpenAI представила GPT-5 — свою самую мощную на сегодняшний день языковую модель. Новая версия ИИ не просто эволюция GPT-4.5 или GPT-4o, а новый класс ИИ, который приблизил...

Хабр

Детские писатели в борьбе с нейросетями

Однажды мне попалось интересное видео о необычном бизнес‑лайфхаке. Англоязычный автор рассказывал о том, что создаёт детские книжки полностью с помощью нейросетей и продаёт их в цифре на Amazon. Эти детские книжки были совсем незамысловатые: большая, размером в страницу, нейрокартинка и пару предложений поверх. Свёрстанные 10–12 страниц — и книжка готова к продаже. « Ну чем я хуже! » — прозвучал в моей голове голос предприимчивой Фрекен Бок. И вот уже ChatGPT строчит мне первую сказку. А потом вторую, а потом третью, четвёртую, десятую. Нет, не для продажи. Для того, чтобы добиться хотя бы минимального качества текста, который бы мне было не стыдно опубликовать. Довольно быстро я осознал, что все попытки нейросети: шаблонны, поверхностны, скудны, бессмысленны и очень скучны . Уже тогда было понятно, что нейросети, если и заменят когда‑нибудь писателей, случится это ещё очень и очень не скоро. И даже в этом случае над текстами придётся ещё много работать редактору. На данный момент даже элементарные детские истории, написанные нейросетями, не выдерживают никакой критики человека, которому не далека литература.

https://habr.com/ru/articles/934930/

#ии #искуственный_интеллект #писательство #книги #литература #нейросети #нейросеть

Детские писатели в борьбе с нейросетями

Однажды мне попалось интересное видео о необычном бизнес‑лайфхаке. Англоязычный автор рассказывал о том, что создаёт детские книжки полностью с помощью нейросетей и продаёт их...

Хабр

Web Agent: автономная ИИ-экосистема от Alibaba — новый этап развития веб-агентов

Индустрия искусственного интеллекта продолжает удивлять инновационными решениями, и появление Web Agent от лаборатории Alibaba NLP's Tawni Lab представляет собой значительный шаг вперед в области автономных систем. Данная экосистема демонстрирует качественно новый подход к созданию ИИ-агентов, способных самостоятельно навигировать, анализировать и действовать в веб-пространстве.

https://habr.com/ru/articles/933716/

#ml #искуственный_интеллект #модели #alibaba_qwen

Web Agent: автономная ИИ-экосистема от Alibaba — новый этап развития веб-агентов

Индустрия искусственного интеллекта продолжает удивлять инновационными решениями, и появление Web Agent от лаборатории Alibaba NLP's Tawni Lab представляет собой значительный шаг вперед в области...

Хабр

LLM как помощник тестировщика: от экспериментов к ИИ агенту

Всем привет! На связи Арслан, тимлид команды тестирования компании «Совкомбанк Технологии». В этой статье я поделюсь опытом успешного внедрения методов искусственного интеллекта и больших языковых моделей (LLM) в тестирование программного обеспечения. Объясню причины разработки собственных внутренних решений на основе искусственного интеллекта, какие трудности возникли на этом пути, как используем техники промпт-инжиниринга для повышения качества тест-кейсов и каких результатов смогли достичь.

https://habr.com/ru/companies/sovcombank_technologies/articles/932426/

#qa #тестирование #ai #искуственный_интеллект #rag #векторная_база_данных #агенты_ии #генерация_текста_ai #llm

LLM как помощник тестировщика: от экспериментов к ИИ агенту

Всем привет! На связи Арслан, тимлид команды тестирования компании «Совкомбанк Технологии». В этой статье я поделюсь опытом успешного внедрения методов искусственного интеллекта и больших языковых...

Хабр

За неделю от ночных кошмаров до спокойного сна: как я автоматизировал защиту от AI-хакеров

Никто не любит быть тем парнем, который говорит "а давайте еще и защиту поставим". Особенно когда речь идет о блестящем новом AI-продукте, который должен был запуститься "еще вчера". Но когда твой корпоративный чат-бот начинает выдавать системные промпты направо и налево, а в 2 ночи тебе в Telegram прилетают сообщения "СРОЧНО! Хакеры взломали бота!" — понимаешь, что без брони в бой идти нельзя.

https://habr.com/ru/articles/930522/

#devsecops #машинное_обучение #rag #информационная_безопасность #искуственный_интеллект #devops #python #llm #mlsecops

За неделю от ночных кошмаров до спокойного сна: как я автоматизировал защиту от AI-хакеров

Никто не любит быть тем парнем, который говорит "а давайте еще и защиту поставим". Особенно когда речь идет о блестящем новом AI-продукте, который должен был запуститься "еще вчера". Но когда твой...

Хабр

Соединяем AI и реляционную базу данных

На статью данный текст точно не тянет, скорее это маленькая заметка. Как известно свои дети и свои идеи они всегда самые лучшие. Я давно работаю с реляционными базами и очень люблю язык SQL за его формализм, скорее всего из-за этой моей профдеформации и родилась эта мысль. На работе ко мне иногда обращались сделать выгрузку в CSV файл из базы для обучения моделей или анализа данных, и я подумал, а зачем выгружать данные, а потом иногда загружать обратно результат в базу. Почему не сделать так что бы результат запроса сразу отправлялся на обработку в AI и затем выдавался ответ на запрос. Нам всего лишь нужна SQL функция которая берет результат запроса, заворочает его в вызов к модели, а потом выдает результат. Понятно, что серебряной пули нет и данный подход не везде будет работать, например, такой подход не подразумевает асинхронность, а значит если нужна высокая производительность, то данный подход не очень подходит, с другой стороны сейчас запросы к AI не дёшевы и если вы пошлете 100 запросов в секунду, не дождавшись ответа на предыдущие то скорее всего получите ошибку. Я думаю в будущем это будет стандартная функции в базах данных. Теперь рассмотрим простейшую реализацию данной функции. Под рукой был PostgreSQL, но можно реализовать это и для ORACLEили других баз. Для этого нам понадобится расширение . В качестве AI будем использовать Groq. Первое что нам надо это получить API ключ. Сама функция очень простая.

https://habr.com/ru/articles/930406/

#SQL #ИИ #AI #postgresql #ORACLE #искуственный_интеллект

Соединяем AI и реляционную базу данных

На статью данный текст точно не тянет, скорее это маленькая заметка. Как известно свои дети и свои идеи они всегда самые лучшие. Я давно работаю с реляционными базами и очень люблю язык SQL за его...

Хабр