Přesuňte se Sora 2, ve městě je žhavá novinka AI videomodel.
Začátkem února společnost ByteDance představila Seedance 2.0, hlavní upgrade svého vlajkového modelu videa, který dříve zůstával poměrně nejasný. Jeho výkonné schopnosti okamžitě šokovaly ekosystém umělé inteligence v Číně, a to i mezi publikem, které bylo kdysi k videu generovanému umělou inteligencí skeptické a považovalo technologii hlavně za způsob, jak produkovat hlouposti.
Feng Ji, zakladatel Game Science, studia, které vyvinulo čínský globální hit videohry Černý mýtus: Wukongnapsal online, že byl „hluboce šokován“ schopnostmi tohoto modelu a věřil, že Seedance 2.0 bude představovat významnou výzvu pro současné čínské předpisy týkající se autorských práv a systémy moderování obsahu. Pan Tianhong, který vede čínské profesionální videoprodukční studio s více než 15 miliony sledujících na sociálních sítích, zveřejnil video, ve kterém řekl, že Seedance 2.0 je výrazně lepší než jakékoli modely pro tvorbu videa, které před ním byly. „Myslí to jako režisér,“ řekl Pan.
Většině lidí se však model v tuto chvíli nemůže dostat do rukou, protože přístup zůstává značně omezený. Od tohoto týdne ByteDance umožňuje zažít Seedance 2.0 pouze stávajícím uživatelům svých aplikací AI pro spotřebitele v Číně – nejoblíbenější je aplikace chatbota Doubao, ale společnost má také matoucí konstelaci méně známých aplikací, jako je Jimeng, Xiaoyunque a Spark. Všechny tyto aplikace jsou určeny pouze pro čínský domácí trh a brání lidem mimo zemi testovat model sami. (Omezení přimělo některé důvtipné lidi v Číně, aby přeprodali své účty ByteDance nedočkavým raným uživatelům AI v zámoří.)
Existují však náznaky, že by se model mohl brzy stát dostupnější. Tento týden společnost ByteDance aktualizovala svou platformu API a zveřejnila navrhovanou cenu Seedance 2.0: Výroba 15sekundového videa, nejdelšího, jaké může právě teď generovat, by stála o něco více než 2 dolary, odhadla čínská publikace IT Home. ByteDance stále neotevřel API přístup vývojářům třetích stran, ale to by mělo být na obzoru.
Afra Wang, autor newsletteru Substack Souběžné a blízký pozorovatel americko-čínského prostředí umělé inteligence mi říká, že Seedance 2.0 je dalším zajímavým příkladem toho, jak se tyto dvě země vydaly odlišnými cestami. Ještě před vydáním Seedance 2.0 byly čínskými společnostmi vyvinuty některé z nejuznávanějších nástrojů AI pro tvorbu videa na světě, jako je Kling AI. „Čína nevytvořila žádný slušný nástroj pro kódování AI, a proto jsou všichni Číňané závislí na Claude Code nebo Codexu; ale pokud jde o video AI, Čína je míle před USA,“ říká Wang.
Ale všechen ten humbuk stranou, Seedance naráží na dva vážné problémy. Týdny po svém vydání se ByteDance potýká s úzkým hrdlem výpočtu, kvůli kterému modelu trvá vygenerování jediného videa hodiny. Mezitím velká filmová studia, včetně Disney, Netflix a Paramount, všechna poslala ByteDance dopisy o zastavení a upuštění, v nichž tvrdí, že výstupy Seedance 2.0 porušují jejich díla chráněná autorským právem. ByteDance okamžitě nevrátil žádost o komentář.
Problém šířky pásma
I když získáte přístup k aplikaci ByteDance AI, stále není snadné generovat video pomocí Seedance 2.0, protože příliš mnoho lidí se snaží dělat totéž a ByteDance musí ještě poskytnout dostatek výpočetních zdrojů pro všechny.
Když jsem se tento týden pokusil vytvořit klip pomocí jedné z aplikací ByteDance, oznámilo mi to, že jsem ve frontě číslo 90 985 a vygenerování pětisekundového videa bude trvat asi čtyři hodiny. Po dvou hodinách čekání mi aplikace oznámila, že mi zbývá ještě šest. V tu chvíli jsem se rozhodl jít spát.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com