Umělá inteligence pro hraní her od Google DeepMind se vypořádá s Blindspot chatbota

Několik let předtím, než ChatGPT začal žvatlat, vyvinul Google velmi odlišný druh programu umělé inteligence s názvem AlphaGo, který se naučil hrát deskovou hru Go s nadlidskými dovednostmi prostřednictvím neúnavného cvičení.

Výzkumníci ze společnosti nyní zveřejnili výzkum, který kombinuje schopnosti velkého jazykového modelu (AI za dnešními chatboty) se schopnostmi AlphaZero, nástupce AlphaGo, který je také schopen hrát šachy, k vyřešení velmi složitých matematických důkazů.

Jejich nový frankensteinovský výtvor, nazvaný AlphaProof, prokázal svou zdatnost tím, že se vypořádal s několika problémy z Mezinárodní matematické olympiády (IMO) 2024, prestižní soutěže pro studenty středních škol.

AlphaProof používá model velkého jazyka Gemini k převodu přirozeně formulovaných matematických otázek do programovacího jazyka zvaného Lean. To poskytuje trénovací krmivo pro druhý algoritmus, který se pomocí pokusů a omylů naučí, jak najít důkazy, které lze potvrdit jako správné.

Začátkem tohoto roku Google DeepMind odhalil další matematický algoritmus nazvaný AlphaGeometry, který také kombinuje jazykový model s odlišným přístupem AI. AlphaGeometry používá Gemini k převodu geometrických problémů do formy, se kterou lze manipulovat a testovat ji program, který zpracovává geometrické prvky. Google dnes také oznámil novou a vylepšenou verzi AlphaGeometry.

Výzkumníci zjistili, že jejich dva matematické programy by mohly poskytnout důkazy pro hádanky IMO stejně jako stříbrný medailista. Programy vyřešily celkem dva problémy algebry a jeden problém teorie čísel ze šesti. Během několika minut došlo k jednomu problému, ale trvalo několik dní, než jsme zjistili další. Google DeepMind nezveřejnil, kolik výkonu počítače vrhlo na problémy.

Google DeepMind nazývá přístup používaný pro AlphaProof i AlphaGeometry „neuro-symbolický“, protože kombinuje čisté strojové učení umělé neuronové sítě, technologii, která je v poslední době oporou největšího pokroku v AI, s jazykem konvenčního programování.

„Zde jsme viděli, že můžete zkombinovat přístup, který byl tak úspěšný, a věci jako AlphaGo, s velkými jazykovými modely a vytvořit něco, co je extrémně schopné,“ říká David Silver, výzkumník Google DeepMind, který vedl práci na AlphaZero. . Silver říká, že techniky demonstrované s AlphaProof by se teoreticky měly rozšířit do dalších oblastí matematiky.

Výzkum skutečně zvyšuje vyhlídky na řešení nejhorších tendencí velkých jazykových modelů aplikací logiky a uvažování více uzemněným způsobem. Jakkoli mohou být velké jazykové modely zázračné, často se snaží pochopit i základní matematiku nebo logicky uvažovat o problémech.

V budoucnu by neurálně-symbolická metoda mohla systémům umělé inteligence poskytnout prostředek, jak převést otázky nebo úkoly do formy, kterou lze zdůvodnit způsobem, který přináší spolehlivé výsledky. O OpenAI se také říká, že pracuje na takovém systému s kódovým označením „Strawberry“.

Dnes však odhalené systémy mají jedno klíčové omezení, jak Silver uznává. Matematická řešení jsou správná nebo nesprávná, což umožňuje AlphaProof a AlphaGeometry dopracovat se ke správné odpovědi. Mnoho problémů v reálném světě – například vymýšlení ideálního itineráře pro cestu – má mnoho možných řešení a které z nich je ideální, může být nejasné. Silver říká, že řešením pro nejednoznačnější otázky může být jazykový model, který se během školení pokusí určit, co představuje „správnou“ odpověď. „Existuje spektrum různých věcí, které lze vyzkoušet,“ říká.

Silver je také opatrný, aby poznamenal, že Google DeepMind nebude vyřazovat lidské matematiky z práce. „Naším cílem je poskytnout systém, který může dokázat cokoliv, ale tím to, co matematici dělají, nekončí,“ říká. „Velká část matematiky spočívá v kladení problémů a hledání zajímavých otázek, na které se lze ptát. Můžete si to představit jako další nástroj ve stylu logaritmického pravítka, kalkulačky nebo výpočetních nástrojů.“

Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com