Simple diffusion – компактная модель генерации изображений

Всем привет! Мы создаем простую, быструю и компактную диффузионную модель, которую можно обучать и запускать на обычных видеокартах, сохранив при этом высокое качество. Simple Diffusion (sdxs-1b) – это первый результат наших опытов, мы публикуем её как альфа-версию под лицензией Apache-2.0 вместе с открытым кодом подготовки данных и обучения. https://huggingface.co/AiArtLab/sdxs-1b TLDR; На обучение SDXL потребовалось ~6 млн долларов. Z-Image говорят обучили всего за 600к. У нас была RTX-4080 и два чемодана желание сделать небольшой прототип быстрой и дешевой модели на imagenet. В процессе мы немного увлеклись. Вероятно удалось создать модель примерно в сотни раз дешевле/быстрее относительно быстро обучаемой SDXL с генерацией близко к реальному времени в высоком разрешении, и без характерных проблем в анатомии, но качество пока в целом ниже (но надеемся будет выше).

https://habr.com/ru/articles/1019532/

#diffusion_models #stablediffusion #texttoimage #texttoimageмодель #diyпроекты

AiArtLab/sdxs-1b · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Design Arena (@Designarena)

Wan2.7-Image가 Design Arena에 추가되었습니다. 향상된 디테일, 더 강한 프롬프트 정합성, 개선된 스타일 제어를 제공하며, Text-to-Image, Image-to-Image, Pro 버전 등 여러 모델을 함께 체험할 수 있습니다.

https://x.com/Designarena/status/2040869623546122697

#texttoimage #imagetoiimage #generativeai #aigeneration

Design Arena (@Designarena) on X

Wan2.7-Image is now on Design Arena! Create stunning visuals with enhanced detail, stronger prompt alignment, and improved stylistic control. Explore all of the models: - Wan 2.7 Text to Image - Wan 2.7 Image to Image - Wan 2.7 Pro Text to Image - Wan 2.7 Pro Image to

X (formerly Twitter)

AshutoshShrivastava (@ai_for_success)

Luma가 새로운 이미지 모델 Uni-1을 출시했다. 텍스트와 레퍼런스 이미지를 잘 활용하며, 특히 텍스트-투-이미지 품질이 매우 강력하다고 언급돼 이미지 생성 분야의 주목할 만한 신제품으로 보인다.

https://x.com/ai_for_success/status/2036150255650218333

#luma #imagegeneration #texttoimage #aimodel #generativeai

AshutoshShrivastava (@ai_for_success) on X

Luma just launched its new image model, Uni-1. I had early access and have been using it for the last few days. It’s extremely powerful. It works really well with text and reference images. But what impressed me most is its text-to-image quality. I ran some of my best prompts,

X (formerly Twitter)

Microsoft MAI-Image-2 promises better AI images, but do we really need another generator?

https://fed.brid.gy/r/https://nerds.xyz/2026/03/mai-image-2-ai-image-generator/

田中義弘 | taziku CEO / AI × Creative (@taziku_co)

Midjourney의 V8 초기가 community 대상 테스트가 시작되었으며, 핵심 업데이트는 화질보다 '추종성(입력에 대한 일관된 반응)'으로 보입니다. 성능은 5배 빨라지고 네이티브 2K 지원, 텍스트 렌더링 개선이 포함되어 실용성이 크게 향상된 인상입니다.

https://x.com/taziku_co/status/2034053066136363412

#midjourney #v8 #texttoimage #imagegeneration #generativeai

田中義弘 | taziku CEO / AI × Creative (@taziku_co) on X

今回のV8アップデートで大きいのは画質より「追従性」かもしれない。 @midjourneyのV8の早期版テストがコミュニティ向けに始まった。 5倍高速、native 2K、text renderingが改善。 より実用的にアップデートされた印象。

X (formerly Twitter)

Jay Sensei (@hckinz)

대다수 주요 텍스트→이미지·텍스트→비디오 생성 시스템은 여전히 핵심에 디퓨전(diffusion) 계열 기법을 사용하고 있으며, flow matching 같은 방법은 사실상 현대화된 디퓨전으로 볼 수 있다는 관찰입니다. 즉, 현재 생성형 비전 모델들의 근간은 여전히 디퓨전 계열 기술에 의존하고 있다는 기술적 통찰을 제공합니다.

https://x.com/hckinz/status/2034056299978362931

#diffusion #flowmatching #texttoimage #texttovideo #generativeai

Jay Sensei👾 (@hckinz) on X

Almost every major text-to-image / text-to-video system still relies on diffusion (or very close relatives like flow matching, which is basically modernized diffusion) at its core.

X (formerly Twitter)

Brie Wensleydale (@SlipperyGem)

모델 제작자가 SmoothMix Ultimate V2(일루스트리어스 계열) 모델을 공개했습니다. 애니메·세미리얼 스타일을 모두 지원하며, 14일 뒤에는 전면 무료 전환 예정입니다. 현재는 'Yellow Buzz' 500으로 즉시 접근 가능하고 Civitai에 모델 페이지가 등록되어 있습니다. 제작자(베이커) 후원 권장.

https://x.com/SlipperyGem/status/2029958721472975146

#civitai #smoothmix #aiart #texttoimage

Brie Wensleydale🧀🐭 (@SlipperyGem) on X

One of my fav model bakers have released SmoothMix Ultimate V2, an Illustrious model. Does both anime and semi-real. Goes fully free in in 14 days, but you can access right now for 500 Yellow Buzz. Support the baker, if you can ~ https://t.co/7RvVeODt7b

X (formerly Twitter)

Artificial Analysis (@ArtificialAnlys)

Google DeepMind의 Nano Banana 2(또는 Gemini 3.1 Flash Image Preview)가 'Artificial Analysis Image Arena'의 텍스트→이미지 부문에서 1위를 차지했다고 보고되었으며, Nano Banana Pro보다 절반 가격으로 소개됩니다. Nano Banana 2는 Google DeepMind가 발표한 최신 Flash급 이미지 생성 모델로, 기존 Nano Banana(Gemini)를 계승하는 모델로 언급됩니다.

https://x.com/ArtificialAnlys/status/2027052241019175148

#google #gemini #texttoimage #generativeai

Artificial Analysis (@ArtificialAnlys) on X

Google's Nano Banana 2 (Gemini 3.1 Flash Image Preview) takes #1 in Text to Image in the Artificial Analysis Image Arena at half the price of Nano Banana Pro! Nano Banana 2 is the latest Flash-tier image model from @GoogleDeepMind , succeeding the original Nano Banana (Gemini

X (formerly Twitter)