Anthropic zahajuje první model AI „Hybrid Dodrici“ na světě

Rozdíl mezi konvenčním modelem a uvažováním je podobný dvěma typům myšlení popsaných ekonomem Nobelovy ceny Michael Kahneman v jeho knize z roku 2011 Rychle a pomalé myšlení: Rychlé a instinktivní myšlení System-1 a pomalejšího myšlení systému-2.

Druh modelu, který umožnil Chatgpt, známý jako model velkého jazyka nebo LLM, vytváří okamžité reakce na výzvu dotazováním na velkou neuronovou síť. Tyto výstupy mohou být nápadně chytré a soudržné, ale mohou selhat při odpovědi na otázky, které vyžadují odůvodnění krok za krokem, včetně jednoduché aritmetiky.

LLM může být nucen napodobovat deliberativní uvažování, pokud je pokyn přijít s plánem, který pak musí následovat. Tento trik však není vždy spolehlivý a modely se obvykle snaží řešit problémy, které vyžadují rozsáhlé a pečlivé plánování. OpenAI, Google a nyní antropic používají metodu strojového učení známou jako učení zesílení, aby se jejich nejnovější modely naučily generovat uvažování, které ukazuje na správné odpovědi. To vyžaduje shromažďování dalších údajů o školení od lidí při řešení konkrétních problémů.

Penn říká, že Claudeův režim uvažování obdržel další údaje o obchodních aplikacích, včetně psaní a fixování kódu, používání počítačů a zodpovězení složitých právních otázek. „Věci, na kterých jsme vylepšili, jsou … technické předměty nebo předměty, které vyžadují dlouhé odůvodnění,“ říká Penn. „To, co máme od našich zákazníků, je velký zájem o nasazení našich modelů do jejich skutečného pracovního vytížení.“

Antropic říká, že Claude 3.7 je obzvláště dobrý v řešení problémů s kódováním, které vyžadují odůvodnění krok za krokem, a na některých benchmarcích, jako je SWE-Bench, překonává OpenAI O1. Společnost dnes vydává nový nástroj nazvaný Claude Code, speciálně navržený pro tento druh kódování pomocí AI-asistovaného.

„Model je již dobrý v kódování,“ říká Penn. Ale „další myšlení by bylo dobré pro případy, které by mohly vyžadovat velmi složité plánování – řekněte se na extrémně velkou kódovou základnu pro společnost.“

Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com