Když OpenAI loni v březnu oznámilo GPT-4, svůj nejnovější velký jazykový model, vyvolalo otřesy technologickým světem. Při chatování, kódování a řešení nejrůznějších ožehavých problémů – včetně školních domácích úkolů, bylo zjevně schopnější než cokoli předtím.
Anthropic, soupeř OpenAI, dnes oznámil, že udělal vlastní pokrok v oblasti AI, který upgraduje chatboty a další případy použití. Ale ačkoliv je nový model podle některých měřítek světovou špičkou, jde spíše o krok vpřed než o velký skok.
Nový model společnosti Anthropic s názvem Claude 3.5 Sonnet je upgradem stávající rodiny Claude 3 modelů AI. Je zběhlejší v řešení matematických, kódovacích a logických problémů měřených běžně používanými benchmarky. Anthropic říká, že je také mnohem rychlejší, lépe rozumí nuancím v jazyce a má dokonce lepší smysl pro humor.
To je bezpochyby užitečné pro lidi, kteří se snaží vytvářet aplikace a služby na modelech umělé inteligence společnosti Anthropic. Ale zprávy společnosti jsou také připomínkou toho, že svět stále čeká na další skok vpřed v AI podobný tomu, který přináší GPT-4.
Již více než rok se buduje očekávání, že OpenAI vydá pokračování s názvem GPT-5, a generální ředitel společnosti Sam Altman podpořil spekulace, že přinese další revoluci ve schopnostech umělé inteligence. Trénink GPT-4 stál více než 100 milionů dolarů a všeobecně se očekává, že GPT-5 bude mnohem větší a dražší.
Ačkoli OpenAI, Google a další vývojáři AI vydali nové modely, které překonávají GPT-4, svět stále čeká na další velký skok. Pokrok v AI se v poslední době stal více inkrementálním a více se spoléhá na inovace v designu a školení modelů spíše než na škálování velikosti modelu a výpočtů hrubou silou, jako to udělal GPT-4.
Michael Gerstenhaber, vedoucí produktu společnosti Anthropic, říká, že nový model Claude 3.5 Sonnet společnosti je větší než jeho předchůdce, ale velkou část své nové schopnosti čerpá z inovací v oblasti školení. Model například dostal zpětnou vazbu, která měla zlepšit jeho logické uvažování.
Anthropic říká, že Claude 3.5 Sonnet překonává nejlepší modely od OpenAI, Google a Facebook v populárních srovnávacích testech umělé inteligence, včetně GPQA, testu odborných znalostí v biologii, fyzice a chemii na postgraduální úrovni; MMLU, test zahrnující informatiku, historii a další témata; a HumanEval, měřítko znalosti kódování. Zlepšení jsou však otázkou několika procentních bodů.
Tento nejnovější pokrok v AI nemusí být revoluční, ale je rychlý: Společnost Anthropic oznámila svou předchozí generaci modelů teprve před třemi měsíci. „Když se podíváte na rychlost změny inteligence, oceníte, jak rychle se pohybujeme,“ říká Gerstenhaber.
Více než rok poté, co GPT-4 podnítil šílenství nových investic do umělé inteligence, se může ukázat jako obtížnější dosáhnout velkých nových skoků ve strojové inteligenci. S modely GPT-4 a podobnými modely trénovanými na obrovském množství online textu, snímků a videa je stále obtížnější najít nové zdroje dat, která by se dala použít pro algoritmy strojového učení. Očekává se, že vytvoření modelů podstatně větších, aby měly větší kapacitu učit se, bude stát miliardy dolarů. Když OpenAI minulý měsíc oznámilo svůj vlastní nedávný upgrade s modelem, který má hlasové a vizuální schopnosti nazvané GPT-4o, zaměřil se spíše na přirozenější a lidštější rozhraní než na podstatně chytřejší schopnosti řešení problémů.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com