Podle trhem fixovaných technických vědátorů a profesionálních skeptiků bublina umělé inteligence praskla a zima je zpět. Fei-Fei Li to nekupuje. Ve skutečnosti Li – která si vysloužila titul „kmotra AI“ – sází na opak. Je na částečný úvazek na Stanfordské univerzitě, aby spoluzaložila společnost s názvem World Labs. Zatímco současná generativní umělá inteligence je založena na jazyce, ona vidí hranici, kde systémy konstruují kompletní světy s fyzikou, logikou a bohatými detaily naší fyzické reality. Je to ambiciózní cíl a navzdory bezútěšným nabobům, kteří říkají, že pokrok v AI dosáhl ponuré plošiny, World Labs je na rychlé cestě financování. Startup je možná rok od toho, aby měl produkt – a vůbec není jasné, jak dobře bude fungovat, kdy a jestli vůbec dorazí – ale investoři nasázeli 230 milionů dolarů a údajně oceňují rodící se startup na miliardu dolarů.
Zhruba před deseti lety pomohl Li AI zahnout za roh tím, že vytvořil ImageNet, databázi digitálních obrázků na zakázku, která umožnila neuronovým sítím být výrazně chytřejší. Cítí, že dnešní modely hlubokého učení potřebují podobnou podporu, pokud má umělá inteligence vytvářet skutečné světy, ať už jde o realistické simulace nebo zcela smyšlené vesmíry. Budoucí George RR Martins by mohl skládat své vysněné světy jako výzvy místo prózy, které byste pak mohli vykreslit a procházet se v nich. „Fyzický svět počítačů je viděn kamerami a počítačový mozek za kamerami,“ říká Li. „Přeměna této vize na uvažování, generování a případnou interakci vyžaduje pochopení fyzické struktury, fyzické dynamiky fyzického světa. A tato technologie se nazývá prostorová inteligence.“ World Labs si říká prostorová zpravodajská společnost a její osud pomůže určit, zda se tento termín stane revolucí nebo pointou.
Li je už léta posedlý prostorovou inteligencí. Zatímco se všichni bavili přes ChatGPT, ona a bývalý student Justin Johnson vzrušeně žvanili v telefonátech o další iteraci AI. „Příští desetiletí bude o generování nového obsahu, který vezme počítačové vidění, hluboké učení a umělou inteligenci z internetového světa a začlení je do prostoru a času,“ říká Johnson, který je nyní odborným asistentem na University of Michigan. .
Li se rozhodl založit společnost na začátku roku 2023 po večeři s Martinem Casadem, průkopníkem virtuálních sítí, který je nyní partnerem Andreessen Horowitz. To je firma VC notoricky známá svým téměř mesiášským objetím AI. Casado vidí AI jako na podobné cestě jako počítačové hry, které začaly s textem, přešly k 2D grafice a nyní mají oslnivé 3D snímky. Prostorová inteligence povede ke změně. Nakonec říká: „Můžete vzít svou oblíbenou knihu, hodit ji do modelu a pak do ní doslova vstoupit a sledovat, jak se hraje v reálném čase, pohlcujícím způsobem,“ říká. Casado a Li se shodli, že prvním krokem k tomu, aby se to stalo, je přesun od velkých jazykových modelů k velkým svět modely.
Li začal sestavovat tým s Johnsonem jako spoluzakladatelem. Casado navrhl další dva lidi – jedním byl Christoph Lassner, který pracoval v Amazonu, Meta’s Reality Labs a Epic Games. Je vynálezcem Pulsaru, schématu vykreslování, které vedlo ke slavné technice zvané 3D Gaussian Splatting. Zní to jako indie kapela na MIT toga party, ale ve skutečnosti je to způsob, jak syntetizovat scény, na rozdíl od jednorázových předmětů. Dalším Casadovým návrhem byl Ben Mildenhall, který vytvořil výkonnou techniku zvanou NeRF – pole neuronového záření – která převádí 2D pixelové obrázky do 3D grafiky. „Vzali jsme do VR objekty ze skutečného světa a udělali jsme je dokonale reálné,“ říká. Odešel z pozice vedoucího výzkumného pracovníka ve společnosti Google, aby se připojil k Liho týmu.
Jedním ze zřejmých cílů velkého světového modelu by bylo vštěpit robotům světový smysl. To je skutečně v plánu World Labs, ale ne na chvíli. První fází je vytvoření modelu s hlubokým pochopením trojrozměrnosti, fyzičnosti a pojmů prostoru a času. Dále přijde fáze, kdy modely podporují rozšířenou realitu. Poté se společnost může ujmout robotizace. Pokud se tato vize naplní, velké světové modely vylepší autonomní auta, automatizované továrny a možná i humanoidní roboty.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com