Mastodawn

Brie Wensleydale (@SlipperyGem)

SpatialEdit 16B가 공개되었으며, 객체 조작(object manipulation)에 특화된 모델로 보인다. Wan 2.1 기반이라는 점이 눈에 띄고, 향후 Comfy 지원도 기대된다고 언급된다. 영상/이미지 편집용 오픈소스 모델의 새로운 활용 사례로 주목할 만하다.

https://x.com/SlipperyGem/status/2043339961349611868

#ai #opensource #imageediting #videogeneration #wan21

Brie Wensleydale🧀🐭 (@SlipperyGem) on X

Spacial Edit 16B and it looks like exactly the type of object manipulation model I've been looking for and its ... Its based on Wan 2.1! Amazing, Wan 2.1 still out here throwing punches. Incredible. Hoping for eventual Comfy support. https://t.co/hK03h85Zte

X (formerly Twitter)

Habr Mar 23

First Principles расчёт realtime видеогенерации

Сколько FLOPS нужно для генерации одной секунды видео в реальном времени? Можно ли достичь этого на одном GPU? А на телефоне? В этой статье я разбираю задачу realtime видеогенерации «от первых принципов» — начинаю с конкретной архитектуры (Wan2.1-14B), считаю FLOPS по каждому слою, калибрую по реальным замерам и последовательно применяю оптимизации: от FlashAttention и step distillation до квантизации и новых GPU. Спойлер: на серверах realtime уже почти здесь, а вот с мобилками всё сложнее.

https://habr.com/ru/articles/1013430/

#video_generation #diffusion #DiT #FLOPS #GPU #realtime #inference #Wan21

First Principles расчёт realtime видеогенерации

Хабр

PsychoticSheep Feb 17

A cat jump is a much better “hello world” than a cyberpunk car. 🐈✨

Two jumps, generated locally with WAN 2.1 (1.3B, fp16) in ComfyUI.
Rendered on my AMD RX 6700 XT via ROCm.

Everything runs locally, no cloud processing, no external APIs.
Just privacy-friendly, open tools and feline physics. 💜

#cat #aicats #CatVideo #AIVideo #TextToVideo #ComfyUI #WAN21 #LocalAI #OpenSource #Privacy #ROCm #AIArt #Fediverse #Cute #linux #foss

PsychoticSheep Feb 17

🎉 Now videos are alive! After finally getting WAN 2.1 running on my RX 6700 XT via ROCm and ComfyUI, even complex prompts can be turned into animated WebPs locally!

These animated WebP were generated locally using ComfyUI and the WAN 2.1 T2V 1.3B (fp16) model.

Model Stack:
- wan2.1_t2v_1.3B_fp16
- umt5_xxl_fp8_e4m3fn_scaled (Text Encoder)
- wan_2.1_vae
- clip_vision_h

The prompt is first converted into embeddings by the UMT5 encoder.
The WAN video model then generates multiple frames using latent diffusion (noise → iterative refinement), ensuring temporal coherence between frames.
The VAE decodes the latent frames into images, exported as an animated WebP.

Prompt execution time: depends on scene complexity, from 521.62 seconds (~8.7 minutes) up to 17 minutes 26 seconds for more complex prompts.

Rendered locally via ROCm on my AMD RX 6700 XT (12GB VRAM).
No cloud. Pure local inference.

#ComfyUI #WAN21 #ROCm #AMD #LocalAI #FOSS #VideoAI #AIvideo #AIGenerated #MachineLearning #DeepLearning #DiffusionModels #TextToVideo #AIArt #CreativeAI #LocalInference #VideoGeneration

Habr May 24, 2025

Генерация видео: Обзор интересных подходов | Text-2-video | Part 2

Освечу базовые концепты из области генерации видео, в этой части разберем уже более современные модели 2025 года, и парочку моделей, с которых все начиналось. Все кратко и четко, только самое основное. Посмотрим на устройство современных топовых SOTA моделей для генерации видео: Wan2.1, Hunyuan video, недавно вышедший подход к облегчению вычислетильных требования FramePack.

https://habr.com/ru/articles/912522/

#computer_vision #нейросети #ml #video_generation #собеседования #stablediffusion #wan21 #comfyui #видеогенератор

Генерация видео: Обзор интересных подходов | Text-2-video | Part 2

Освещу базовые концепты в области генерации видео. В этой части рассмотрю как современные модели 2025 года, так и несколько ключевых архитектур, с которых всё начиналось. Всё кратко и по делу — только...

Хабр

Techwok Apr 8, 2025

Íme egy elképesztő eszköz, amivel teljesen INGYEN 🆓 lehet videókat 🎬 generálni! Csak beírod a kíván tartalmat ✍️, vagy feltöltesz egy fotót 🏞️, az AI összerakja a videót, s az eredmény... 🤯 döbbenetesen jó! Mindenképp ki kell próbálnotok! 😉 ✨

#Techwok #VideóGenerálás #MesterségesIntelligencia #Wan21 #IngyenesEszközök

https://techwok.hu/2025/04/08/videok-generalasa-ingyen-fotok-alapjan-is

Videók generálása ingyen, akár fotók alapján is, döbbenetes kivitelben - Techwok

Íme egy eszköz, amellyel a videók generálása ingyen megoldható. Szöveges leírás, vagy akár fotók alapján egyaránt. Döbbenetes kivitelben!

Techwok

やまねこインフォ Mar 10, 2025

最近、SNSでも動画を作る機会が増えましたよね。
でも、「難しそう」「時間がかかりそう」って動画づくりにハードルを感じていませんか？

そんなときに活躍するのが、話題の動画生成AI「WAN2.1」です。

AIが自動で映像を組み立ててくれるので、映像制作の知識がほとんどなくてもステキな動画が作れちゃうんです。

本記事では、WAN2.1の基本的な使い方やおすすめの活用シーンをカンタンに解説します。

読めば、商品紹介動画、SNS投稿にもバッチリ活かせるヒントがつかめるはずですよ。

#note
#WAN21
#SeaArt

https://note.com/8091_info/n/ne674c4f5f51d?sub_rt=share_sb

話題の動画生成AI『WAN2.1』とは？カンタン解説｜やまねこインフォ

最近、SNSでも動画を作る機会が増えましたよね。でも、「難しそう」「時間がかかりそう」って動画づくりにハードルを感じていませんか？そんなときに活躍するのが、話題の動画生成AI「WAN2.1」です。 AIが自動で映像を組み立ててくれるので、映像制作の知識がほとんどなくてもステキな動画が作れちゃうんです。本記事では、WAN2.1の基本的な使い方やおすすめの活用シーンをカンタンに解説します。読めば、商品紹介動画、SNS投稿にもバッチリ活かせるヒントがつかめるはずですよ。 WAN2.1って何？ WAN2.1は、中国のアリババの研究チームが開発したAIの仕組み（モデル）です。プ

note（ノート）