Эксперимент. Нейросети снова рисуют картины из игры «Detroit: Become Human»

В компьютерной игре Detroit: Become Human (Детройт: Стать Человеком, 2018) несколько игровых персонажей-андроидов, и каждый обладает своей уникальной историей. Особый интерес представляет история андроида-помощника Маркуса, поскольку именно она раскрывает главный конфликт в мире Детройта. В игре есть интересный эпизод, когда Маркус пробует себя в рисовании по наставлению своего хозяина, художника Карла Манфреда. И в свое время этот эпизод натолкнул меня провести любопытный эксперимент. Что же происходит в эпизоде и в чем суть эксперимента? Разбираемся по порядку.

https://habr.com/ru/articles/890310/

#нейросети_для_генерации_изображений #нейросеть #deepseek #kandinsky #kandinsky_22 #kandinsky_31 #chatgpt #detroitbecomehuman #jedisurvivor

Эксперимент. Нейросети снова рисуют картины из игры «Detroit: Become Human»

В видеоигре Detroit: Become Human (Детройт: Стать Человеком, 2018) несколько игровых персонажей-андроидов, и каждый обладает своей уникальной историей. Особый интерес представляет...

Хабр

Kandinsky 3.1 — новая быстрая модель генерации изображений по тексту

2023 год можно смело называть годом бурного развития генеративного искусственного интеллекта. Это касается не только привычной нам модальности изображений (Kandinsky 2.1, 2.2, 3.0, Stable Diffusion XL, IF, Шедеврум и др.), но и текстовой (ChatGPT, GPT-4, LLaMA, Falcon, GigaChat и др.), аудио (VALL-E, MusicLM и др.), 3D (Magic3D и др.), и даже модальности видео (Kandinsky Video, Gen-2, CogVideo и др.). В 2024 всё движется ещё более впечатляющими темпами: картинки (SD3), видео (Sora), музыка (Suno) и т. д. При этом все основные игроки стараются равномерно двигаться вперёд и повышать качество синтеза. Текстовые чат‑боты научились взаимодействовать с внешними системами посредством плагинов, синтез изображений вышел на уровень фотореалистичных генераций, длина генерируемых видео постепенно увеличивается с сохранением сюжетной связности между кадрами. И такой прогресс обусловлен уже не только наращиванием вычислительных мощностей, но и большим числом неординарных архитектурных решений, которые позволяют добиваться лучшего качества, а также сложными технологиями инженерии данных, позволяющими создавать огромные и в то же время очень качественные наборы данных для обучения моделей. В ноябре прошлого года, на конференции AI Journey, наша команда также представила новое поколение text-to-image-модели Kandinsky 3.0. В целом упростив архитектуру и взяв более мощный текстовый кодировщик по сравнению с семейством моделей Kandinsky 2.x, нам удалось добиться значительного роста в качестве изображений с точки зрения реалистичности и детализации, улучшить понимание текста и побить качество модели SDXL на side-by-side-сравнении с точки зрения человеческих предпочтений, что является наиболее показательной метрикой качества в задаче генерации. Подробнее о модели Kandinsky 3.0 можно прочитать в этой статье статье . Также, на базе этой модели в том же ноябре мы выпустили первую российскую модель генерации видео по тексту Kandinsky Video, о которой можно больше узнать здесь .

https://habr.com/ru/companies/sberbank/articles/805337/

#kandinsky_31 #multimodality #sberai #sberdevices #airi #generative_models #kandinsky #computervision #texttoimage

Kandinsky 3.1 — новая быстрая модель генерации изображений по тексту

Введение 2023 год можно смело называть годом бурного развития генеративного искусственного интеллекта. Это касается не только привычной нам модальности изображений (Kandinsky 2.1, 2.2, 3.0, Stable...

Хабр