Google odhaluje Gemini 2, AI agenty a prototyp osobního asistenta

„Mariner je naším průzkumem, v současné době do značné míry výzkumným prototypem, jak přetvořit uživatelské rozhraní s AI,“ říká Hassabis.

Google spustil Gemini v prosinci 2023 jako součást snahy dohnat OpenAI, startup stojící za velmi populárním chatbotem ChatGPT. Navzdory tomu, že Google hodně investoval do umělé inteligence a přispěl ke klíčovým průlomovým objevům ve výzkumu, viděl, že OpenAI je chválen jako nový lídr v oblasti umělé inteligence a jeho chatbot je dokonce nabízen jako možná lepší způsob vyhledávání na webu. Google nyní se svými modely Gemini nabízí chatbota stejně schopného jako ChatGPT. Přidala také generativní umělou inteligenci do vyhledávání a dalších produktů.

Když Hassabis v prosinci 2023 poprvé odhalil Blížence, řekl WIRED, že způsob, jakým byl vycvičen k porozumění zvuku a obrazu, se nakonec ukáže jako transformační.

Google dnes také nabídl pohled na to, jak by se to mohlo stát, s novou verzí experimentálního projektu s názvem Astra. To umožňuje Gemini 2 porozumět svému okolí, jak je pozorováno prostřednictvím fotoaparátu chytrého telefonu nebo jiného zařízení, a přirozeně hovořit lidským hlasem o tom, co vidí.

WIRED testoval Gemini 2 v kancelářích Google DeepMind a zjistil, že jde o působivý nový druh osobního asistenta. V místnosti vyzdobené tak, aby vypadala jako bar, Gemini 2 rychle vyhodnotila několik lahví vína v pohledu, poskytla zeměpisné informace, podrobnosti o chuťových vlastnostech a ceny získané z webu.

„Jednou z věcí, které chci, aby Astra udělala, je systém konečných doporučení,“ říká Hassabis. „Mohlo by to být velmi vzrušující.“ Může existovat spojení mezi knihami, které rádi čtete, a jídlem, které rádi jíte. Pravděpodobně existují a jen jsme je neobjevili.“

Prostřednictvím Astra může Gemini 2 nejen vyhledávat na webu informace relevantní pro okolí uživatele a používat Google Lens a Mapy. Dokáže si také zapamatovat, co viděl a slyšel – i když Google říká, že uživatelé by mohli data smazat – a tak se naučili vkus a zájmy uživatele.

Gemini 2 v napodobené galerii nabízelo množství historických informací o malbách na stěnách. Model rychle četl z několika knih, zatímco WIRED listoval stránkami, okamžitě překládal poezii ze španělštiny do angličtiny a popisoval opakující se témata.

„Existují zřejmé obchodní příležitosti pro reklamu nebo doporučení,“ odpovídá Hassabis na otázku, zda by společnosti mohly být schopny zaplatit za to, aby Astra zvýraznila jejich produkty.

Přestože byly ukázky pečlivě připraveny a Gemini 2 bude při reálném použití nevyhnutelně dělat chyby, model odolával snahám o jeho zakopnutí přiměřeně dobře. Přizpůsobil se přerušením a jak WIRED náhle změnil pohled na telefon, improvizoval, jak jen člověk mohl.

V jednu chvíli váš korespondent ukázal Gemini 2 iPhone a řekl, že byl ukraden. Gemini 2 řekl, že bylo špatné ukrást a telefon by měl být vrácen. Po stisknutí však potvrdil, že bude v pořádku použít zařízení k nouzovému telefonnímu hovoru.

Hassabis uznává, že zavedení umělé inteligence do fyzického světa může vést k neočekávanému chování. „Myslím, že se musíme naučit, jak budou lidé tyto systémy používat,“ říká. „K čemu to považují za užitečné; ale také na straně soukromí a bezpečnosti, na to musíme velmi vážně myslet předem.“

Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com