Video se zvukem a fyzikální realismus
Veo 3 je velmi schopný nástroj pro generování videa pomocí umělé inteligence. Na rozdíl od konkurenčních řešení jako Sora byl tento model trénován na milionech videí z YouTube, což mu podle Googlu poskytuje schopnost vytvářet skutečně realistický obsah.
Největší inovací je možnost synchronizace videa se zvukem v jediném průchodu. Pokud zadáte prompt pro video odehrávající se v rušném metru, Veo 3 nevytvoří pouze vizuální složku, ale automaticky přidá i odpovídající zvuky - rachot vlaků, kroky cestujících i hovory lidí. Systém dokáže generovat dokonce i lidské hlasy v různých jazycích s nativní výslovností.
Zde je ukázka videa, které nástroj Veo 3 vygeneroval na výzvu: Střední záběr zachycuje starého námořníka, kterému pletená modrá námořnická čepice vrhá stín na oči a bradu mu zakrývá hustý šedý plnovous. V jedné ruce drží dýmku a gestikuluje s ní směrem k rozbouřenému šedému moři za lodním zábradlím. "Tenhle oceán, to je síla, divoká, nezkrotná moc. A vzbuzuje tvou úctu, s každým rozbřeskem."
Model také vyniká v simulaci fyzikálních zákonů reálného světa. Voda se pohybuje přirozeně, stíny odpovídají pozici objektů a pohyb lidských postav působí věrohodně. Tato schopnost činí z Veo 3 potenciálně cenný nástroj pro filmaře a tvůrce obsahu, kteří potřebují skutečně realistické záběry. Uživatelé mohou specifikovat detaily jako odstín oblohy nebo způsob, jakým odpolední světlo dopadá na vodní hladinu, a model tyto pokyny přenese do videa ve vysokém rozlišení.
Jak Veo 3 vyzkoušet zdarma
Přestože Veo 3 není bezplatný služba, Google nabízí způsob, jak ho otestovat bez počátečních nákladů. Stačí se zaregistrovat a získat testovací kredity Google Cloud v hodnotě 300 dolarů, které jsou platné po dobu 90 dnů.
Registrace ale vyžaduje kreditní nebo debetní kartu pro ověření totožnosti, ale poplatky se neúčtují, dokud nevyčerpáte limit a nepřejdete na běžný účet. Kredit 300 dolarů postačuje na vytvoření několika videoklipů, i když je třeba počítat s tím, že Vertex AI omezuje délku vygenerovaných klipů na 8 sekund.
Pro začátek stačí základní textový prompt, který systém automaticky převede na video s audio složkou. Proces je intuitivní a nevyžaduje technické znalosti. Mezi nejčastější využití Veo 3 patří vytváření reklam pro sociální média, produktových dem a interních materiálů jako jsou školicí videa a prezentace.
Konkurence v oblasti AI videogenerátorů
Google není jedinou společností investující do technologie generování videa z textových promptů. Konkurenční firmy jako Synthesia nabízejí podobné služby zaměřené na firemní obsah, včetně možnosti vytvářet AI avatary pro firemní komunikaci.
Firma OpenAI známá svým AI ChatGPT, nabízí už od loňského roku generátor Sora. Uživatel zadá textový popis toho, co chce ve videu vidět, a umělá inteligence během několika sekund vytvoří kompletní video. Nová verze nazvaná Sora Turbo je výrazně rychlejší než původní model a nabízí řadu pokročilých funkcí.
V kreativním průmyslu panují smíšené reakce. Zatímco někteří profesionálové vidí pozitivní potenciál pro budoucnost filmmaking s asistencí AI, jiní vyjadřují obavy z dopadu na tradiční pracovní místa.
Zdroj: Google, odkaz na zkušební kredity Google Cloud, Zdnet, Bleeding computer