Zapomeňte na chatboty. Agenti AI jsou budoucnost







Tento týden startup s názvem Cognition AI způsobil svým vydáním trochu rozruch demo ukazující program umělé inteligence nazvaný Devin vykonávající práci obvykle vykonávanou dobře placenými softwarovými inženýry. Chatboti jako ChatGPT a Gemini dokážou generovat kód, ale Devin šel dále, plánoval, jak vyřešit problém, napsal kód a poté jej otestoval a implementoval.

Tvůrci Devin jej označují jako „vývojář softwaru AI“. Když byl Devin požádán, aby otestoval, jak funguje jazykový model Llama 2 s otevřeným zdrojovým kódem společnosti Meta, když k němu přistupují různé společnosti, které jej hostují, vygeneroval plán krok za krokem pro projekt, vygeneroval kód potřebný pro přístup k rozhraním API a spouštění srovnávacích testů a vytvořil webovou stránku. shrnutí výsledků.

Je vždy těžké posuzovat inscenovaná dema, ale Cognition ukázalo, že Devin zvládá širokou škálu působivých úkolů. To ohromil investory a inženýry na X, dostává spoustu potvrzenía dokonce inspiroval trochu memy—včetně některých předpovědí, že Devin brzy bude odpovědný kvůli vlně propouštění v technologickém průmyslu.

Devin je jen nejnovějším a nejvybroušenějším příkladem trendu, který už nějakou dobu sleduji – objevení se agentů umělé inteligence, kteří namísto pouhého poskytování odpovědí nebo rad ohledně problému prezentovaného člověkem mohou podniknout kroky k jeho vyřešení. Před několika měsíci jsem testoval Auto-GPT, program s otevřeným zdrojovým kódem, který se pokouší dělat užitečné práce tím, že provádí akce na počítači a na webu. Nedávno jsem testoval další program s názvem vimGPT, abych zjistil, jak mohou vizuální dovednosti nových modelů umělé inteligence pomoci těmto agentům procházet web efektivněji.

Byl jsem ohromen svými experimenty s těmito agenty. Zatím však stejně jako jazykové modely, které je pohánějí, dělají poměrně dost chyb. A když software provádí akce, nejen generuje text, jedna chyba může znamenat totální selhání – a potenciálně nákladné nebo nebezpečné následky. Zúžení rozsahu úkolů, které může agent dělat, řekněme, na konkrétní sadu úkolů softwarového inženýrství se zdá být chytrým způsobem, jak snížit chybovost, ale stále existuje mnoho potenciálních způsobů, jak selhat.

Nejen startupy budují agenty AI. Začátkem tohoto týdne jsem psal o agentovi jménem SIMA, vyvinutém společností Google DeepMind, který hraje videohry včetně skutečně šíleného titulu. Kozí simulátor 3. SIMA se při sledování lidských hráčů naučila, jak dělat více než 600 poměrně komplikovaných úkolů, jako je pokácení stromu nebo sestřelení asteroidu. A co je nejdůležitější, mnoho z těchto akcí dokáže úspěšně provádět i v neznámé hře. Google DeepMind tomu říká „generalista“.

Mám podezření, že Google doufá, že tito agenti budou nakonec pracovat mimo videohry a možná jim pomohou používat web jménem uživatele nebo pro něj provozovat software. Ale videohry jsou dobrým pískovištěm pro vývoj a testování agentů tím, že poskytují komplexní prostředí, ve kterých je lze testovat a vylepšovat. „Zpřesnění je něco, na čem aktivně pracujeme,“ řekl mi Tim Harley, vědecký pracovník společnosti Google DeepMind. „Máme různé nápady.“

V nadcházejících měsících můžete očekávat mnohem více novinek o agentech AI. Demis Hassabis, generální ředitel společnosti Google DeepMind, mi nedávno řekl, že má v plánu spojit velké jazykové modely s prací, kterou jeho společnost již dříve odváděla školicími programy umělé inteligence pro hraní videoher s cílem vyvinout schopnější a spolehlivější agenty. „Tohle je rozhodně obrovská oblast. V tomto směru hodně investujeme a myslím si, že ostatní také.“ řekl Hassabis. „Bude to skoková změna ve schopnostech těchto typů systémů – až se začnou více podobat agentům.“







Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com