T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала! Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI, а также стажер‑исследователь Центра глубинного обучения и байесовских методов НИУ ВШЭ. Cегодня я расскажу про наше свежее исследование T‑LoRA: Single Image Diffusion Model Customization Without Overfitting . Мы с коллегами придумали эффективный способ как файнтюнить диффузионные модели с помощью LoRA всего по одной картинке . Представьте такую ситуацию: вы хотите, чтобы модель генерировала вашу кошечку узнаваемой и в самых разных сценариях, но у вас нет времени или желания собирать обширный разнообразный датасет. А может, у вас вообще есть всего одна фотография (с хозяевами кошек так обычно не бывает, но допустим). Хорошая новость: эту задачу можно решить, копнув поглубже в свойства диффузии! В этой статье я расскажу, как это сделать.

https://habr.com/ru/companies/airi/articles/958348/

#diffusion_models #finetuning #loraадаптеры #lora #image_generation

T-LoRA: дообучить диффузионную модель на одной картинке и не переобучиться

Вы когда‑нибудь мечтали стать лучшей версией себя? Моложе, красивее, идеальнее… А вот LoRA уже стала! Меня зовут Вера Соболева, я научный сотрудник лаборатории FusionBrain Института AIRI,...

Хабр

Часть-1. Почему ИИ рисует каракули вместо текста: анатомия проблемы и дорожная карта решений

Привет, чемпионы! Давайте начистоту. Вы уже перепробовали все: и промпты в кавычках, и уговоры на английском, и даже шептали запросы своему GPU. Результат? Очередная вывеска с текстом, напоминающим древние руны, переведенные через пять языков. Знакомо? Это наша общая, фундаментальная боль, и сегодня мы не будем ее заливать кофеином и надеждой. Мы возьмем ее, положим на операционный стол и проведем полную анатомическую диссекцию.

https://habr.com/ru/companies/datafeel/articles/952664/

#ml #ai #design #texttoimage #image_generation #text_generation #fix_text_on_image #contentmaker #contentmarketing #midjourney

Часть-1. Почему ИИ рисует каракули вместо текста: анатомия проблемы и дорожная карта решений

Привет, чемпионы! Давайте начистоту. Вы уже перепробовали все: и промпты в кавычках, и уговоры на английском, и даже шептали запросы своему GPU. Результат? Очередная вывеска с текстом, напоминающим...

Хабр

Seedream v4 — платный конкурент Nano Banana. Зачем он тогда нужен? И как использовать бесплатно + Гайды

Да, Seedream v4 от ByteDance - доступен только платно . Тогда зачем он нужен, если есть Nano Banana? Разбираемся!

https://habr.com/ru/articles/954638/

#seedream4 #nano_banana #нейрофотошоп #AIфоторедактор #генерация_изображений #inpainting #Сравнение_Seedream_v4_и_Nano_Banana #image_generation #outpainting #иифотошоп

Seedream v4 — платный конкурент Nano Banana. Зачем он тогда нужен? И как использовать бесплатно + Гайды

Да, Seedream v4 от ByteDance - доступен только платно . Тогда зачем он нужен, если есть Nano Banana? Разбираемся! Итак, Nano Banana — больше про быстрые и простые правки, бесплатно, но с водяными...

Хабр

20+ кейсов с изображениями в ChatGPT. Или экономим 100,000₽+ на дизайнерах

С момента, как OpenAI выпустила свой новый генератор картинок, прошло уже почти 3 месяца. Хайп уже давно прошел, а у меня дошли руки до статьи на Хабре Эта статья про полезные юзкейсы генерации картинок, с которыми каждый из вас может сталкиваться. Постарался найти такие юзкейсы, которые у графических дизайнеров будут стоить десятки тысяч рублей 💫 Внутри много примеров, прям много Узнать, как экономить 💰 на дизайнерах

https://habr.com/ru/articles/920274/

#llm #chatgpt #designer #ai #image_generation

20+ кейсов с изображениями в ChatGPT. Или экономим 100,000₽+ на дизайнерах

С момента, как OpenAI выпустила свой новый генератор картинок, прошло уже почти 3 месяца. Хайп уже давно прошел, а у меня дошли руки до статьи на Хабре Эта статья про полезные юзкейсы генерации...

Хабр

Do you want to see something strange? Try to edit an image with chatgpt. You get a recreation of your image where everything is the same and completely different at the same time. It's like chatgpt gets prompted with a very specific prompt of your image. I made a short blog post about this very strange LLM upside-down version of the world.

https://oyvindsolheim.com/posts/25_04_02_uncanny/

#chatgpt
#llm #image_generation #AI

Solheim: An uncanny valley

How images edited by ChatGPT are only recreations of the original.

Solheim

[Перевод] Spring AI научился видеть! Показываю, как заставить GPT находить бананы на картинках

Новый перевод от команды Spring АйО расскажет вам о работе с мультимодальностью при работе со Spring AI и о различных вариантах работы с графическими изображениями с использованием искусственного интеллекта.

https://habr.com/ru/companies/spring_aio/articles/889974/

#spring_ai #multimodality #images #image_generation #image_recognition

Spring AI научился видеть! Показываю, как заставить GPT находить бананы на картинках

Новый перевод от команды Spring АйО расскажет вам о работе с мультимодальностью при работе со Spring AI и о различных вариантах работы с графическими изображениями с использованием искусственного...

Хабр
I Made Stable Diffusion XL Smarter by Finetuning it on Bad AI-Generated Images

And then telling it to not generate those images!