Aby umělá inteligence mohla komunikovat se skutečným světem, získá fyzickou inteligenci

Nedávné modely umělé inteligence jsou překvapivě lidské ve své schopnosti generovat text, zvuk a video na výzvu. Doposud však tyto algoritmy většinou zůstávaly odsunuty do digitálního světa, spíše než do fyzického, trojrozměrného světa, ve kterém žijeme. Ve skutečnosti, kdykoli se pokusíme aplikovat tyto modely na skutečný svět, i ten nejsofistikovanější zápas o adekvátní výkon — vzpomeňte si například na to, jak náročné bylo vyvinout bezpečná a spolehlivá samořídící auta. I když jsou tyto modely uměle inteligentní, nejenže nemají přehled o fyzice, ale také často halucinují, což je vede k nevysvětlitelným chybám.

Toto je však rok, kdy AI konečně udělá skok z digitálního světa do skutečného světa, který obýváme. Rozšíření umělé inteligence za její digitální hranice vyžaduje přepracování toho, jak stroje myslí, a spojení digitální inteligence umělé inteligence s mechanickou zdatností robotiky. Tomu říkám „fyzická inteligence“, nová forma inteligentního stroje, který dokáže porozumět dynamickému prostředí, vyrovnat se s nepředvídatelností a rozhodovat se v reálném čase. Na rozdíl od modelů používaných standardní AI je fyzická inteligence zakořeněna ve fyzice; v pochopení základních principů reálného světa, jako je příčina-následek.

Tyto funkce umožňují modelům fyzické inteligence interagovat a přizpůsobovat se různým prostředím. V mé výzkumné skupině na MIT vyvíjíme modely fyzické inteligence, které nazýváme tekuté sítě. V jednom experimentu jsme například vycvičili dva drony – jeden provozovaný standardním modelem umělé inteligence a druhý tekutou sítí – aby během léta lokalizovaly objekty v lese pomocí dat zachycených lidskými piloty. Zatímco oba drony fungovaly stejně dobře, když měly za úkol dělat přesně to, k čemu byly vycvičeny, když byly požádány, aby lokalizovaly objekty za různých okolností – v zimě nebo v městském prostředí – svůj úkol úspěšně dokončil pouze dron s tekutou sítí. Tento experiment nám ukázal, že na rozdíl od tradičních systémů umělé inteligence, které se po počáteční tréninkové fázi přestanou vyvíjet, se tekuté sítě i nadále učí a přizpůsobují ze zkušeností, stejně jako lidé.

Fyzická inteligence je také schopna interpretovat a fyzicky provádět složité příkazy odvozené z textu nebo obrázků, čímž překlenuje propast mezi digitálními instrukcemi a prováděním v reálném světě. Například v mé laboratoři jsme vyvinuli fyzicky inteligentní systém, který za méně než minutu dokáže iterativně navrhnout a následně 3D tisknout malé roboty na základě výzev jako „robot, který může jít vpřed“ nebo „robot, který se může chytit“. objekty“.

Další laboratoře také dělají významný průlom. Například robotický startup Covariant, založený výzkumným pracovníkem UC-Berkeley Pieterem Abbeelem, vyvíjí chatboty – podobné ChatGTP – které dokážou ovládat robotická ramena, když jsou vyzváni. Na vývoj a nasazení třídicích robotů ve skladech po celém světě již zajistili více než 222 milionů dolarů. Tým z Carnegie Mellon University také nedávno prokázal, že robot s pouze jednou kamerou a nepřesným ovládáním může provádět dynamické a složité parkourové pohyby – včetně skákání na překážky dvojnásobné jeho výšky a přes mezery dvakrát tak dlouhé – pomocí jediné neuronové sítě trénované pomocí zesílení. učení.

Pokud byl rok 2023 rokem převodu textu na obrázek a rok 2024 převodu textu na video, pak rok 2025 bude znamenat éru fyzické inteligence s novou generací zařízení – nejen robotů, ale také čehokoli od rozvodných sítí po chytré domácnosti. – které dokáže interpretovat, co jim říkáme, a provádět úkoly v reálném světě.

Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com