動画生成AI「Vidu」で存在感。生数科技、約140億円調達で記録更新
動画生成AI「Vidu」で存在感。生数科技、約140億円調達で記録更新
Koniec renderowania w nieskończoność. TurboDiffusion skraca czas generowania wideo o… 200 razy
Jeśli generowanie klipów wideo przez AI kojarzyło wam się z długim oczekiwaniem na wynik, chińskie ShengShu Technology właśnie zmienia zasady gry.
Nowy framework TurboDiffusion pozwala generować wideo w czasie zbliżonym do rzeczywistego, osiągając wyniki nawet 200 razy szybciej niż dotychczasowe modele.
ShengShu Technology we współpracy z laboratorium TSAIL Uniwersytetu Tsinghua udostępniło kod źródłowy rozwiązania o nazwie TurboDiffusion. Twórcy określają to wydarzenie mianem „momentu DeepSeek” dla modeli wideo – czyli punktem zwrotnym, który pozwala na masowe i tanie wdrażanie technologii, która dotąd była droga i powolna.
Z 15 minut do 8 sekund
Największe wrażenie robią twarde dane z testów. Zastosowanie TurboDiffusion do autorskiego modelu Vidu pozwoliło na wygenerowanie 8-sekundowego klipu w jakości 1080p w zaledwie 8 sekund. Dla porównania – wcześniej ten sam proces zajmował około 900 sekund (15 minut). Oznacza to przejście z mozolnego renderowania do generowania treści niemal w czasie rzeczywistym.
Co istotne dla entuzjastów sprzętu, tak drastyczny skok wydajności (od 100 do 200 razy szybciej) osiągnięto na pojedynczej karcie graficznej RTX 5090. Owszem, to bardzo drogi sprzęt (ok. 15 000 zł), ale tańszy niż… centrum danych.
Jak oni to zrobili? Cztery filary przyspieszenia
ShengShu i Tsinghua twierdzą, że nie jest to wynik jednej sztuczki, ale połączenia czterech zaawansowanych technik optymalizacji, które nie degradują jakości obrazu:
Kod TurboDiffusion został udostępniony jako open-source, co oznacza, że wkrótce rozwiązania te mogą trafić do szerokiego grona twórców i innych modeli AI.
Google Photos trafi natywnie na telewizory Samsunga. W pakiecie edycja AI i Nano Banana
#AIWideo #generatywnaSztucznaInteligencja #openSource #RTX5090 #ShengShuTechnology #TurboDiffusion #Vidu動画生成が100倍速くなる!清華大×生数科技、高速化フレームワーク「TurboDiffusion」発表