Jay Sensei (@hckinz)
영상 생성 리더보드에서 Kling 3.0에 이어 2위를 차지한 모델은 PixVerse 5.6으로 보고됨. PixVerse 5.6은 text-to-video(t2v)와 image-to-video(i2v) 양쪽에서 높은 순위를 기록하며 영상 생성 분야에서 주목받고 있음.
Jay Sensei (@hckinz)
영상 생성 리더보드에서 Kling 3.0에 이어 2위를 차지한 모델은 PixVerse 5.6으로 보고됨. PixVerse 5.6은 text-to-video(t2v)와 image-to-video(i2v) 양쪽에서 높은 순위를 기록하며 영상 생성 분야에서 주목받고 있음.
Wan 2.6 вышел и уже доступен на Replicate и fal. Да, ещё один видеогенератор. Нет, это не проходняк.
Что умеет: — Text-to-Video и Image-to-Video до 1080p
— ролики до 15 секунд
— native audio или загрузка своего
— multi-shot сцены для внятного сторителлинга, а не одного дерганого кадра
— reference-to-video: 1–3 рефа для консистентных персонажей и объектов
Цены: — 720p: $0.10 за сек
— 1080p: $0.15 за сек
replicate.com/wan-video/wan-2.6-t2v
fal.ai/models/wan/v2.6/text-to-video
#ai #t2v
Video Killed the Energy Budget:
Characterizing the Latency and Power Regimes of
Open #Text-to-Video Models
Recent advances in text-to-video (#T2V) generation have enabled the creation of high-fidelity, temporally coherent clips from natural language prompts. ... In this paper, we present a systematic study of the latency and energy consumption of state-of-the-art open-source T2V models.
https://arxiv.org/pdf/2509.19222
Дослідники з ByteDance Inc. та Каліфорнійського університету в Берклі розробили Video Custom Diffusion (VCD) — просту, але потужну платформу для створення відео з контрольованою ідентичністю суб’єкта.
Дослідники з ByteDance Inc. та Каліфорнійського університету в Берклі розробили Video Custom Diffusion (VCD) — просту, але потужну платформу для створення відео з контрольованою ідентичністю суб'єкта.
Baidu Forscher stellen neue Möglichkeit für die Text-zu-Video-Generierung vor!
#ki #ai #kuenstlicheintelligenz #textzuvideo #videogenerierung #computervision #deeplearning #texttovideo #t2v #videoproduktion #avatare #erklärvideos #untertitel
https://kinews24.de/baidu-stellt-videogen-vor-ki-generiert-jetzt-videos-in-kinoqualitaet