Demis Hassabis z Google DeepMind říká, že Gemini je nové plemeno umělé inteligence







Demis Hassabis se nikdy neostýchal hlásat velké skoky v umělé inteligenci. Nejpozoruhodnější je, že se proslavil v roce 2016 poté, co se robot s názvem AlphaGo naučil hrát složitou a jemnou deskovou hru Go s nadlidskými dovednostmi a vynalézavostí.

Hassabis dnes říká, že jeho tým ve společnosti Google udělal větší krok vpřed – pro něj, společnost a doufejme i širší oblast AI. Gemini, model umělé inteligence, který Google dnes oznámil, podle něj otevírá neprošlapanou cestu v umělé inteligenci, která by mohla vést k zásadním novým průlomům.

„Jako neurovědec i počítačový vědec jsem roky chtěl zkusit a vytvořit jakousi novou generaci modelů umělé inteligence, které jsou inspirovány tím, jak interagujeme a chápeme svět všemi smysly,“ řekl Hassabis. WIRED před dnešním oznámením. Gemini je „velkým krokem k tomuto druhu modelu,“ říká. Google popisuje Gemini jako „multimodální“, protože dokáže zpracovávat informace ve formě textu, zvuku, obrázků a videa.

Počáteční verze Gemini bude ode dneška dostupná prostřednictvím chatbota společnosti Google Bard. Společnost říká, že nejvýkonnější verze modelu, Gemini Ultra, bude uvedena na trh příští rok a překonává GPT-4, model za ChatGPT, v několika běžných měřítcích. Videa vydaná společností Google ukazují, jak Gemini řeší úkoly, které zahrnují složité uvažování, a také příklady modelu kombinující informace z textových obrázků, zvuku a videa.

„Až dosud měla většina modelů jakousi aproximovanou multimodalitu trénováním samostatných modulů a jejich následným spojením,“ říká Hassabis v něčem, co se zdálo být zastřeným odkazem na technologii OpenAI. „To je pro některé úkoly v pořádku, ale v multimodálním prostoru nemůžete mít tak hluboké komplexní uvažování.“

OpenAI spustila v září upgrade na ChatGPT, který dal chatbotovi možnost pořizovat obrázky a zvuk jako vstup kromě textu. OpenAI nezveřejnila technické podrobnosti o tom, jak to GPT-4 dělá, ani technický základ svých multimodálních schopností.

Hra Catchup

Google vyvinul a spustil Gemini s pozoruhodnou rychlostí ve srovnání s předchozími projekty AI ve společnosti, poháněné nedávnými obavami z hrozby, kterou by pro budoucnost Google mohl představovat vývoj OpenAI a dalších.

Na konci roku 2022 byl Google považován za lídra v oblasti umělé inteligence mezi velkými technologickými společnostmi, přičemž řada výzkumníků umělé inteligence v této oblasti významně přispěla. Generální ředitel Sundar Pichai prohlásil, že jeho strategie pro společnost je „AI na prvním místě“ a Google úspěšně přidal AI do mnoha svých produktů, od vyhledávání po chytré telefony.





Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com