Google prezentuje Veo 3.1. Lepszy dźwięk i edycja w wideo generowanym przez AI

Google ogłosił wprowadzenie znaczących aktualizacji do swojego narzędzia do tworzenia wideo Flow, napędzanego przez nowy model sztucznej inteligencji Veo 3.1.

Najważniejsze zmiany to dodanie obsługi dźwięku do kluczowych funkcji oraz wprowadzenie zaawansowanych opcji edycji, dających użytkownikom większą kontrolę nad finalnym materiałem.

Sercem nowości jest model Veo 3.1, który stanowi rozwinięcie poprzedniej wersji. Według Google, nowa odsłona charakteryzuje się lepszym rozumieniem poleceń tekstowych (promptów), wyższą jakością audiowizualną oraz zwiększonym realizmem generowanych obrazów, w tym wierniejszym odwzorowaniem tekstur. To właśnie ten model napędza nowe możliwości, które trafiają do aplikacji Flow, gdzie od momentu jej premiery pięć miesięcy temu wygenerowano już ponad 275 milionów filmów.

Sztuczna inteligencja Veo 3 ożywi Twoje zdjęcia. Google Photos z dużą aktualizacją

Po raz pierwszy Google wprowadza generowany przez AI dźwięk do istniejących już funkcji kreatywnych. Od teraz audio będzie tworzone w ramach opcji takich jak: „Składniki do wideo” (generowanie sceny na podstawie wielu obrazów referencyjnych), „Klatki do wideo” (tworzenie płynnego przejścia między obrazem początkowym i końcowym) oraz „Przedłuż” (wydłużanie istniejących klipów wideo). Ma to na celu tworzenie bardziej kompletnych i spójnych narracji wizualnych.

Największą nowością są jednak zaawansowane narzędzia edycyjne, które pozwolą na modyfikowanie już wygenerowanych scen. Pierwszą z nich jest funkcja „Wstaw”, umożliwiająca dodanie do klipu dowolnego obiektu – od realistycznych detali po fantastyczne postacie. Jak zapewnia Google, system potrafi przy tym uwzględnić złożone detale, takie jak cienie i oświetlenie sceny, aby dodany element wyglądał naturalnie. Wkrótce ma się również pojawić funkcja „Usuń”, która pozwoli na bezproblemowe wymazanie niechcianych obiektów, automatycznie rekonstruując tło.

Nowa era wideo dzięki AI? Modele Google Veo 3 i Veo 3 Fast trafiają na platformę Vertex AI. Globalnie

Nowe możliwości napędzane przez model Veo 3.1 są już udostępniane użytkownikom narzędzia Flow. Jednocześnie technologia trafia do deweloperów poprzez API Gemini oraz do klientów korporacyjnych w ramach platformy Vertex AI. Zaktualizowane funkcje będą również dostępne w aplikacji Gemini.

Efekty? Zobaczcie sami na poniższym wideo udostępnionym przez Google DeepMind:

#AI #edycjaWideo #Flow #Gemini #generowanieWideo #Google #news #sztucznaInteligencja #textToVideo #Veo31 #wideoZAI

OpenAI wprowadza zmiany w Sora. Lepsza kontrola dla twórców i nowy model zarabiania

Sam Altman, CEO OpenAI, zapowiedział dwie kluczowe zmiany w funkcjonowaniu modelu do generowania wideo Sora.

To pierwsza tak istotna aktualizacja strategii od czasu premiery narzędzia, która jest bezpośrednią odpowiedzią na opinie użytkowników i, co najważniejsze, właścicieli praw autorskich. Zmiany dotyczą zarówno kontroli nad generowanymi treściami, jak i monetyzacji usługi. O samej technologii Sora pisaliśmy już szerzej na łamach iMagazine.

Sora, rewolucyjny generator wideo od OpenAI, trafia na iPhone’a. Jest jednak pewien haczyk, a nawet dwa

Pierwsza i najważniejsza zmiana to ukłon w stronę właścicieli praw autorskich. OpenAI przyznało, że użytkownicy pokochali tworzenie „interaktywnej fikcji fanowskiej”, czyli generowanie filmów z udziałem znanych postaci z popkultury. W odpowiedzi na to firma wprowadzi szczegółowe narzędzia kontroli dla twórców. Będą oni mogli precyzyjnie określić, w jaki sposób ich postacie mogą być wykorzystywane przez AI, włącznie z całkowitym zablokowaniem takiej możliwości. Altman podkreślił, że celem jest stworzenie na tyle atrakcyjnego systemu, by wielu twórców chciało w nim uczestniczyć, ale ostateczna decyzja zawsze będzie należeć do nich. W swoim wpisie zwrócił też szczególną uwagę na „niezwykłą kreatywność Japonii”, doceniając głęboką więź użytkowników z japońskimi treściami.

Nadgryzieni 512: Japonia – prawie wszystko co musisz wiedzieć przed pierwszą podróżą

Druga zmiana ma charakter biznesowy. Altman otwarcie przyznał, że generowanie wideo jest bardzo kosztowne, a popularność Sory przerosła oczekiwania firmy – użytkownicy tworzą znacznie więcej materiałów, niż początkowo zakładano. W związku z tym OpenAI musi zacząć zarabiać na generowaniu wideo. Planowane jest wprowadzenie modelu monetyzacji, którego kluczowym elementem ma być dzielenie się przychodami z tymi właścicielami praw autorskich, którzy zdecydują się udostępnić swoje postacie do wykorzystania przez użytkowników. Dokładny model finansowy jest jeszcze w fazie testów, ale ma to być sposób na stworzenie sprawiedliwego i zrównoważonego ekosystemu.

CEO OpenAI zapowiedział, że użytkownicy powinni spodziewać się bardzo szybkiego tempa zmian, porównując obecny okres do „wczesnych dni ChataGPT”. Przyznał, że firma będzie popełniać błędy, ale zamierza szybko na nie reagować, wsłuchując się w opinie społeczności. Doświadczenia i rozwiązania wypracowane przy okazji rozwoju Sory mają być w przyszłości konsekwentnie wdrażane w pozostałych produktach OpenAI.

OpenAI udostępniło AI Sora – generatywną sztuczną inteligencję do tworzenia wideo

#AI #generowanieWideo #monetyzacja #news #OpenAI #prawaAutorskie #SamAltman #Sora #sztucznaInteligencja #technologia

YouTube Music z zapowiedziami albumów, a podcasty dostaną… własne wideo z AI

YouTube i YouTube Music ogłosiły szereg innowacyjnych funkcji, które w najbliższych miesiącach trafią do użytkowników i twórców.

Platformy stawiają na głębsze połączenie fanów z artystami oraz na masowe wykorzystanie sztucznej inteligencji, która pozwoli audio-podcastom zyskać wizualną formę, a twórcom ułatwi produkcję treści.

Podczas wydarzenia Made on YouTube 2025 zaprezentowano wizję przyszłości, w której AI odgrywa kluczową rolę w tworzeniu i konsumpcji treści. Nowości mają pojawić się zarówno w sekcji muzycznej, jak i podcastowej.

YouTube idzie w ślady Netfliksa. Rusza weryfikacja planów rodzinnych Premium

YouTube Music dąży do zbudowania bardziej osobistej relacji między artystami a ich najbardziej oddanymi fanami. Ma się to przejawiać w następujących rozwiązaniach:

  • Wstępny zapis albumów i singli: w ciągu najbliższych tygodni użytkownicy otrzymają funkcję „Pre-save” (wstępnego zapisania) nadchodzących albumów lub singli. Będzie można zobaczyć stronę albumu przed premierą, śledzić odliczanie do premiery oraz otrzymywać powiadomienia o nowych wydaniach.
  • Wideo „tylko dla fanów”: na początku przyszłego roku artyści będą mogli wysyłać swoim najbardziej oddanym fanom ekskluzywne wideo (np. Shorts) zza kulis, podziękowania czy inne treści.
  • Ekskluzywne materiały: YouTube Music pilotuje program (na razie w USA), który da najlepszym fanom wczesny dostęp do limitowanych edycji produktów.

Popularność podcastów na YouTube rośnie – w lipcu 2025 roku użytkownicy spędzali na nich ponad 100 milionów godzin dziennie, z czego ponad 30% stanowiły transmisje na żywo. YouTube wychodzi naprzeciw twórcom, oferując narzędzia AI, które mają zrewolucjonizować ten format:

  • AI generuje wideo z audio: na początku przyszłego roku wybrani podcasterzy otrzymają możliwość automatycznego generowania komponentu wideo dla podcastów, które do tej pory były dostępne wyłącznie w formie audio. Wystarczy wybrać „styl wizualny” (np. dokumentalny, film noir, anime, animacja 3D, bokeh, szkic), a sztuczna inteligencja stworzy grafikę pasującą do omawianej treści. Szersze wdrożenie tej funkcji zaplanowano na koniec 2026 roku.
  • Automatyczne klipy i Shorts z AI: w ciągu kilku miesięcy twórcy będą mogli automatycznie tworzyć klipy z podcastów wideo, z sugestiami generowanymi przez AI. Interfejs będzie zawierał transkrypcję, co ułatwi edycję. Sugestie klipów idealnych do formatu YouTube Shorts pojawią się na początku przyszłego roku.

Te zmiany pokazują, jak intensywnie Google inwestuje w rozwój YouTube jako kompleksowej platformy dla muzyki, wideo i podcastów, wykorzystując potencjał sztucznej inteligencji do wzmocnienia relacji z użytkownikami i wsparcia twórców.

YouTube pod piracką banderą? Platforma oskarżana o czerpanie zysków z nielegalnych filmów

#AI #artyści #generowanieWideo #Google #klipy #news #podcasty #PreSave #Shorts #sztucznaInteligencja #twórcy #YouTubeMusic #YouTubePodcasts

Sztuczna inteligencja Veo 3 ożywi Twoje zdjęcia. Google Photos z dużą aktualizacją

Google ogłosiło dużą aktualizację dla swojej usługi Zdjęcia Google, która wprowadza dwie kluczowe nowości: centralną zakładkę „Utwórz” (Create), grupującą wszystkie kreatywne narzędzia, oraz integrację zaawansowanego modelu do generowania wideo Veo 3.

Nowe funkcje mają na celu ułatwienie użytkownikom kreatywnego wykorzystywania ich bibliotek zdjęć i wspomnień. Centralnym punktem zmian jest nowa zakładka „Utwórz”, która staje się centrum dowodzenia dla wszystkich narzędzi opartych na generatywnej sztucznej inteligencji.

Nowa zakładka „Utwórz” (Create) ma za zadanie uporządkować i ułatwić dostęp do wszystkich kreatywnych funkcji w Zdjęciach Google. Użytkownicy znajdą tam w jednym miejscu takie narzędzia jak tworzenie kolaży, pokazy slajdów czy animacji. Co ważne, Google podkreśla, że zakładka ma również ułatwiać odkrywanie nowych możliwości i łączenie różnych funkcji – na przykład przerobienie zdjęcia za pomocą funkcji Remix, a następnie ożywienie go za pomocą wideo.

Nowa zakładka jest obecnie udostępniana użytkownikom w Stanach Zjednoczonych. Nie podano jeszcze informacji, kiedy trafi do kolejnych regionów, w tym do Polski.

Jednak najciekawszą nowością jest ulepszenie funkcji „Zdjęcie w wideo” (Photo to video) poprzez integrację z Veo 3, jednym z najbardziej zaawansowanych generatywnych modeli AI od Google. Proces jest bardzo prosty: użytkownik wybiera zdjęcie, a następnie jedną z dwóch opcji – „Subtelny ruch” lub „Szczęśliwy traf” – a sztuczna inteligencja generuje na tej podstawie krótki klip wideo.

Warto zaznaczyć, że funkcja będzie miała ograniczenia. Użytkownicy darmowej wersji Zdjęć Google otrzymają limitowaną liczbę generacji wideo dziennie. Większe możliwości w tym zakresie będą mieli subskrybenci płatnych planów Google AI Pro oraz Ultra. W nowej zakładce znajdzie się również znana już funkcja Remix, która pozwala przetwarzać zdjęcia na różne style (np. anime, komiks, szkic), a także narzędzie do tworzenia filmów z najciekawszymi momentami (Highlight videos) czy zdjęć kinematograficznych (Cinematic photos).

Aplikacja Zdjęcia Google powie ci, czy fotografia jest dziełem AI

#AI #aktualizacja #Android #CreateTab #generowanieWideo #Google #GooglePhotos #iOS #news #Oprogramowanie #sztucznaInteligencja #Utwórz #Veo3 #zdjęciaGoogle

Gemini ożywi twoje zdjęcia. Nowa funkcja zamieni fotografie w wideo z dźwiękiem

Google wprowadza nową funkcję do swojego narzędzia AI, Gemini. Od teraz użytkownicy będą mogli przekształcać statyczne fotografie w dynamiczne, ośmiosekundowe klipy wideo. Za generowanie filmów odpowiada zaawansowany model Veo 3, który został udostępniony szerszemu gronu odbiorców w maju tego roku.

Proces tworzenia wideo ze zdjęcia jest prosty. Wystarczy w oknie Gemini wybrać opcję „Wideo”, a następnie przesłać wybraną fotografię. Kolejnym krokiem jest opisanie w polu tekstowym, w jaki sposób obraz ma zostać ożywiony oraz jakie dźwięki mają towarzyszyć animacji. Sztuczna inteligencja na podstawie tych wytycznych wygeneruje krótki film. Google sugeruje, że funkcja ta świetnie sprawdzi się do animowania codziennych przedmiotów, ożywiania rysunków i obrazów czy dodawania ruchu do scen natury.

Nowa możliwość jest częścią szerszej strategii Google związanej z rozwojem narzędzi do generowania wideo. Firma poinformowała, że w ciągu ostatnich siedmiu tygodni użytkownicy stworzyli już ponad 40 milionów filmów przy użyciu modelu Veo 3 za pośrednictwem aplikacji Gemini oraz Flow, specjalistycznego narzędzia AI do tworzenia filmów. Funkcja przekształcania zdjęć w wideo jest obecnie wdrażana dla subskrybentów planów Google AI Pro oraz Ultra w wybranych krajach.

Google podkreśla również swoje zaangażowanie w kwestie bezpieczeństwa i odpowiedzialnego korzystania z technologii. Wszystkie filmy generowane przez AI są oznaczane widocznym znakiem wodnym, informującym o ich pochodzeniu. Dodatkowo, w plikach zaszywany jest niewidoczny cyfrowy znak wodny SynthID. Firma zapewnia, że prowadzi szeroko zakrojone testy (tzw. red teaming) w celu identyfikacji i eliminacji potencjalnych zagrożeń oraz egzekwuje politykę dotyczącą niedozwolonych treści.

Google wprowadza w Polsce Veo 3. Sztuczna inteligencja wygeneruje dla ciebie wideo z dźwiękiem

#AI #Flow #Gemini #generowanieWideo #Google #GoogleAIPro #news #SynthID #sztucznaInteligencja #technologia #Veo3 #wideoZeZdjęcia

Google wprowadza w Polsce Veo 3. Sztuczna inteligencja wygeneruje dla ciebie wideo z dźwiękiem

Google udostępnił w Polsce swój najnowszy i najbardziej zaawansowany model do generowania wideo – Veo 3. Narzędzie, które potrafi tworzyć krótkie filmy wraz z dźwiękiem na podstawie opisów tekstowych, jest dostępne w aplikacji Gemini dla subskrybentów płatnego pakietu Google AI Pro.

Veo 3 to przełomowe narzędzie, które pozwala użytkownikom na ożywienie swoich kreatywnych pomysłów. Aby z niego skorzystać, wystarczy w aplikacji Gemini wybrać opcję „Film”, a następnie w polu tekstowym (tzw. prompcie) opisać scenę, którą chce się stworzyć. W odpowiedzi sztuczna inteligencja wygeneruje ośmiosekundowy klip wideo w rozdzielczości 720p, w formacie panoramicznym 16:9. Gotowy materiał, dostarczany jako plik MP4, będzie zawierał nie tylko obraz, ale również dopasowane dźwięki, dialogi czy muzykę.

Jakość wygenerowanego filmu jest w dużej mierze zależna od precyzji opisu. Google zaleca, aby w promptach uwzględniać jak najwięcej szczegółów, takich jak wygląd głównych postaci, sceneria, wykonywane przez nie czynności czy ogólny styl i nastrój klipu (np. „styl anime”, „film noir”, „komedia z lat 80.”). Możliwe jest również dodawanie instrukcji dla wirtualnej kamery, na przykład „ujęcie z bliska” czy „ujęcie z lotu ptaka”, a także precyzowanie charakteru dialogów, np. „szeptane nerwowo”.

Ważnym aspektem działania Veo 3 jest transparentność. Każdy film stworzony za pomocą tego narzędzia jest oznaczany na dwa sposoby. Posiada widoczny znak wodny w prawym dolnym rogu oraz niewidoczny cyfrowy znak wodny o nazwie SynthID. Dzięki temu możliwe jest łatwe zidentyfikowanie materiałów, które zostały wygenerowane przez sztuczną inteligencję, co ma na celu zapewnienie przejrzystości.

Udostępnienie Veo 3 w Polsce otwiera nowe możliwości dla twórców, pozwalając na szybkie wizualizowanie koncepcji, tworzenie krótkich klipów na potrzeby mediów społecznościowych czy zamienianie pomysłów w ruchome obrazy. Narzędzie jest już dostępne dla płacących użytkowników usługi Google AI Pro.

Google Earth obchodzi 20-lecie: nowe funkcje i fascynująca historia

#AI #Gemini #generowanieWideo #Google #GoogleAIPro #news #premiera #sztucznaInteligencja #technologia #Veo3

Midjourney uruchamia swój pierwszy model do generowania wideo z AI: Midjourney V1

Midjourney, jeden z najpopularniejszych startupów zajmujących się generowaniem obrazów za pomocą sztucznej inteligencji, ogłosił w środę premierę swojego pierwszego, długo oczekiwanego modelu do tworzenia wideo – V1.

Nowe narzędzie działa na zasadzie „image-to-video”, co oznacza, że użytkownicy mogą przesłać istniejący obraz – własny lub wygenerowany wcześniej przez Midjourney – na podstawie którego model V1 stworzy zestaw czterech pięciosekundowych klipów wideo.  Podobnie jak w przypadku generatora obrazów, usługa jest dostępna wyłącznie za pośrednictwem platformy Discord.

Zapraszamy do społeczności iMagazine na Discordzie

Użytkownicy mają do dyspozycji kilka ustawień pozwalających na kontrolowanie finalnego efektu. Mogą wybrać automatyczną animację lub ręcznie opisać w formie tekstowej, jaki ruch chcą nadać obrazowi. Dostępna jest także opcja regulacji intensywności ruchu kamery i obiektu („low motion” lub „high motion”).  Choć podstawowa długość wideo to pięć sekund, można je czterokrotnie przedłużyć o cztery sekundy, osiągając maksymalnie 21 sekund.

OpenAI udostępniło AI Sora – generatywną sztuczną inteligencję do tworzenia wideo

Wraz z premierą V1, Midjourney staje do rywalizacji z innymi modelami wideo AI, takimi jak Sora od OpenAI, Gen 4 od Runway czy Veo 3 od Google.  Firma podkreśla jednak, że jej celem nie jest jedynie generowanie materiałów do użytku komercyjnego. Dyrektor generalny David Holz stwierdził, że model wideo jest kolejnym krokiem w kierunku ostatecznego celu firmy, czyli tworzenia modeli AI zdolnych do „symulacji otwartego świata w czasie rzeczywistym”.  W dalszej perspektywie firma planuje rozwój narzędzi do renderowania 3D oraz modeli AI działających w czasie rzeczywistym.

Runway wprowadza Gen-4: coraz trudniej poznać, że wideo jest wygenerowane przez AI

Jeśli chodzi o koszty, generowanie wideo jest wycenione ośmiokrotnie drożej niż tworzenie obrazu, co oznacza, że użytkownicy z podstawowymi planami szybciej zużyją swoje miesięczne limity.  Najtańszym sposobem na wypróbowanie V1 jest subskrypcja planu Basic za 10 dolarów miesięcznie.  Użytkownicy droższych planów (Pro za 60 USD i Mega za 120 USD) otrzymają nielimitowane generowanie wideo w wolniejszym trybie „Relax”.

Premiera V1 ma miejsce zaledwie tydzień po tym, jak Midjourney zostało pozwane przez studia filmowe Disney i Universal. Pozew dotyczy rzekomego naruszenia praw autorskich poprzez generowanie obrazów przedstawiających postacie należące do studiów, takie jak Homer Simpson czy Darth Vader. Efekty pracy nowej AI do wideo możecie obejrzeć w poniższym wpisie na X:

Introducing our V1 Video Model. It's fun, easy, and beautiful. Available at 10$/month, it's the first video model for *everyone* and it's available now. pic.twitter.com/iBm0KAN8uy

— Midjourney (@midjourney) June 18, 2025

 

#AIDoGenerowaniaWideo #generowanieWideo #Midjourney #MidjourneyV1 #news #sztucznaInteligencja

Gemini umożliwia generowanie filmów z modelem Veo 2

Google ogłosiło wprowadzenie nowej funkcji w aplikacji Gemini, umożliwiającej użytkownikom Gemini Advanced generowanie 8-sekundowych filmów za pomocą modelu Veo 2.

Funkcja jest już dostępna, pozwala tworzyć klipy wideo w rozdzielczości 720p na podstawie tekstowych opisów. Model Veo 2 jest zintegrowany z aplikacją Gemini na urządzeniach mobilnych i w wersji przeglądarkowej.

Veo 2 is super fun to play with, and people have been creating some amazing videos with it. Its implicit understanding of the physics of the world is kind of mindblowing. Looking forward to seeing more people enjoy it now that it’s part of @GeminiApp! https://t.co/bMqLCmNHmd

— Demis Hassabis (@demishassabis) April 15, 2025

Aby wygenerować film, użytkownicy wybierają model Veo 2 z menu aplikacji Gemini i wprowadzają opis sceny, którą chcą stworzyć. Im bardziej szczegółowy prompt, tym większa kontrola nad efektem końcowym. Wyprodukowane filmy są zapisywane w formacie MP4 w proporcjach 16:9 i mogą być udostępniane w mediach społecznościowych, takich jak TikTok czy YouTube Shorts. Wszystkie klipy są oznaczane cyfrowym znakiem wodnym SynthID, wskazującym, że zostały stworzone przez sztuczną inteligencję.

Google podkreśla, że Veo 2 wyróżnia się zaawansowanym rozumieniem fizyki i ruchu ludzkiego, co pozwala na tworzenie realistycznych scen i płynnych animacji w różnych stylach. Funkcja jest obecnie ograniczona do generowania filmów na podstawie tekstu, ale firma zapowiada prace nad rozszerzeniem możliwości modelu.

Użytkownicy Gemini Advanced mogą korzystać z tej opcji w ramach subskrypcji Google One AI Premium, kosztującej 97,99 zł miesięcznie w Polsce. Nowa funkcja jest również dostępna w eksperymentalnym projekcie Google Labs o nazwie Whisk, gdzie użytkownicy mogą przekształcać obrazy w animacje za pomocą Veo 2. Wdrożenie rozpoczęło się 15 kwietnia i potrwa kilka tygodni, obejmując wszystkie języki obsługiwane przez Gemini, w tym polski. Google nie podało szczegółów dotyczących miesięcznych limitów generowania filmów, ale użytkownicy będą informowani o zbliżaniu się do limitu.

Wprowadzenie Veo 2 do Gemini jest kolejnym krokiem w rozwoju generatywnej sztucznej inteligencji Google, mającym na celu zwiększenie kreatywnych możliwości użytkowników. Firma zachęca do testowania nowej funkcji i dzielenia się opiniami, które pomogą w dalszym udoskonalaniu modelu. Czy Veo 2 pojawi się również w wersji bezpłatnej Gemini? Na ten temat Google milczy. Oczywiście powyższe ilustracje to stopklatki z przykładowych klipów wygenerowanych przez debiutującą funkcję w Gemini Advanced.

Google Cloud prezentuje przełomowe rozwiązania AI na Next ‘25

#AI #Gemini #generowanieWideo #Google #news #sztucznaInteligencja #Veo2

Runway wprowadza Gen-4: coraz trudniej poznać, że wideo jest wygenerowane przez AI

Runway pochwaliło się swoim najnowszym generatywnym modelem AI do tworzenia wideo: Runway Gen-4. Przełom polega na tym, że nowość generuje spójne wizualnie sceny bez zniekształceń postaci czy scenerii.

Runway, firma specjalizująca się w sztucznej inteligencji do generowania wideo, ogłosiła premierę swojego najnowszego modelu – Gen-4. Nowa technologia, będąca następcą modelu Gen-3 Alpha, wprowadza przełomowe ulepszenia w zakresie spójności postaci, lokalizacji i obiektów w generowanych filmach, a także oferuje bardziej realistyczną fizykę ruchu. Model jest już udostępniany użytkownikom płatnym oraz klientom korporacyjnym, zdaniem twórców może zrewolucjonizować proces tworzenia narracyjnych treści wideo.

Gen-4 rozwiązuje jeden z największych problemów generatywnego wideo – brak spójności wizualnej między ujęciami. W przeciwieństwie do wcześniejszych modeli, takich jak Gen-2 czy Gen-3, które miały trudności z utrzymaniem jednolitości postaci i tła w różnych ujęciach, Gen-4 pozwala na tworzenie sekwencji z zachowaniem ciągłości wizualnej. Dzięki temu filmowcy mogą generować wideo z dynamicznym ruchem kamery i realistycznymi efektami, ale bez nienaturalnych czy też niepożądanych zniekształceń prezentowanych obiektów, co otwiera nowe możliwości dla dłuższych form narracyjnych, takich jak filmy fabularne. Runway podkreśla, że model ten jest odpowiedzią na potrzeby profesjonalistów z branży kreatywnej, w tym projektantów i reżyserów.

Model Gen-4 opiera się na technologii image-to-video, umożliwiając tworzenie wideo na podstawie obrazów referencyjnych i instrukcji tekstowych. Użytkownicy mogą precyzyjnie kontrolować style, postaci i lokalizacje, co zapewnia większą kontrolę nad narracją. Runway zademonstrowało możliwości modelu, publikując teledysk wygenerowany w całości za pomocą Gen-4, co spotkało się z entuzjastycznym odbiorem. Rzeczony materiał poniżej:

Runway podkreśla, że nie walczy z klasyczną kinematografią, lecz ją wspiera. Zresztą firma współpracuje z Hollywood – m.in. ze studiem Lionsgate, tworząc dedykowane modele AI oparte na katalogu ponad 20 000 tytułów.

Runway od lat buduje swoją markę, koncentrując się na potrzebach filmowców, w odróżnieniu od konkurentów, takich jak OpenAI, którzy stawiają na bardziej uniwersalne narzędzia wideo. Gen-4 to kolejny krok w kierunku stworzenia kompleksowego procesu produkcyjnego wideo – od uchwycenia mimiki (dzięki funkcji Act-One) po generowanie spójnych sekwencji wideo. Firma uruchomiła także fundusz Hundred Film Fund, oferując twórcom do 1 miliona dolarów na produkcje wykorzystujące AI, co pokazuje jej ambicje w transformacji przemysłu filmowego.

Wprowadzenie Gen-4 jest określane jako „szczególny moment” w rozwoju technologii AI dla mediów. Choć model wciąż ma ograniczenia – np. generuje klatki w rozdzielczości 720p, co jest poniżej standardu 4K wymaganego w nowoczesnych produkcjach – jego możliwości wskazują na ogromny potencjał. To co wydawało się najtrudniejsze, czyli zachowanie spójności sceny, udało się uzyskać. Rozdzielczość wyniku to kwestia skali i mocy, a nie wyrafinowania „myślenia” AI. Nie da się ukryć, że wygenerowane przez najnowszy model Gen-4 klipy robią wrażenie. Ciekawe jak odpowie OpenAI ze swoim modelem Sora.

OpenAI udostępniło AI Sora – generatywną sztuczną inteligencję do tworzenia wideo

#AI #Gen4 #generowanieWideo #news #Runway #sztucznaInteligencja

OpenAI udostępniło AI Sora – generatywną sztuczną inteligencję do tworzenia wideo | iMagazine

OpenAI wreszcie udostępniło generatywny model Sora, integrując go m.in. z topowym poziomem subskrypcji ChatGPT Pro.

Veo 2 zmienia oblicze YouTube Shorts: rewolucja AI w zasięgu ręki

W dobie, gdy sztuczna inteligencja (AI) staje się nieodłączną częścią naszego życia, a treści generowane przez AI zalewają media społecznościowe, Google idzie

ROOTBLOG.pl