Nvidia dnes oznámila, že vydává rodinu základních modelů umělé inteligence s názvem Cosmos, které lze použít k výcviku humanoidů, průmyslových robotů a samořídících aut. Zatímco jazykové modely se učí generovat text školením na velkém množství knih, článků a příspěvků na sociálních sítích, Cosmos je navržen tak, aby generoval obrázky a 3D modely fyzického světa.
Během klíčové prezentace na výroční konferenci CES v Las Vegas ukázal generální ředitel Nvidia Jensen Huang příklady využití Cosmos k simulaci činností uvnitř skladů. Cosmos byl trénován na 20 milionech hodin skutečných záběrů „lidských chůzí, pohybu rukou, manipulace s věcmi,“ řekl Jensen. „Nejde o generování kreativního obsahu, ale o to, naučit AI porozumět fyzickému světu.“
Výzkumníci a startupy doufají, že tyto druhy základních modelů by mohly dát robotům používaným v továrnách a domácnostech sofistikovanější schopnosti. Cosmos může například generovat realistické krabice s videozáznamy padajícími z regálů ve skladu, které lze použít k výcviku robota, aby rozpoznával nehody. Uživatelé mohou také doladit modely pomocí vlastních dat.
Řada společností již používá Cosmos, říká Nvidia, včetně startupů s humanoidními roboty Agility a Figure AI a také společností s autonomním řízením, jako jsou Uber, Waabi a Wayve.
Nvidia také oznámila software navržený tak, aby pomohl různým druhům robotů naučit se efektivněji vykonávat nové úkoly. Nová funkce je součástí stávající platformy pro simulaci robotů Isaac společnosti Nvidia, která umožní konstruktérům robotů vzít si malý počet příkladů požadovaného úkolu, jako je uchopení určitého předmětu, a generovat velké množství syntetických tréninkových dat.
Nvidia doufá, že Cosmos a Isaac osloví společnosti, které chtějí stavět a používat humanoidní roboty. Jensenovi se na pódiu na CES připojily obrázky 14 různých humanoidních robotů v životní velikosti vyvinuté společnostmi včetně Tesla, Boston Dynamics, Agility a Figure.
Spolu s Cosmos oznámila Nvidia také Project Digits, „osobní superpočítač s umělou inteligencí“ v hodnotě 3 000 USD, který může provozovat velký jazykový model s až 200 miliardami parametrů bez potřeby cloudových služeb jako AWS nebo Microsoft. Společnost také oznámila své vysoce očekávané GPU RTX Blackwell nové generace a přicházející softwarové nástroje, které pomohou vytvářet agenty AI.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com