Nové modely OpenAI GPT 4.1 vynikají při kódování







OpenAI dnes oznámil, že vydává novou rodinu modelů umělé inteligence optimalizované tak, aby vynikaly při kódování, protože zvyšuje úsilí o odrazení stále tvrdě konkurence společností jako Google a Antropic. Modely jsou k dispozici vývojářům prostřednictvím rozhraní Open OpenAI Application Programming Interface (API).

OpenAI vydává tři velikosti modelů: GPT 4.1, GPT 4.1 Mini a GPT 4.1 Nano. Kevin Weil, hlavní produktový ředitel společnosti OpenAI, na živém proudu uvedl, že nové modely jsou lepší než nejpoužívanější model OpenAI, GPT-4o a lepší než jeho největší a nejsilnější model, GPT-4.5, v některých ohledech.

GPT-4.1 skóroval 55 procent na SWE-Bench, široce používaný měřítko pro měření zdatnosti kódovacích modelů. Skóre je několik procentních bodů nad body ostatních modelů OpenAI. Nové modely jsou „skvělé v kódování, jsou skvělé ve složité výuce, jsou fantastické pro stavební agenty,“ řekl Weil.

Kapacita pro modely AI pro psaní a úpravu kódu se v posledních měsících výrazně zlepšila, což umožnilo automatizovanější způsoby prototypování softwaru a zlepšuje schopnosti takzvaných agentů AI. Soupeři jako antropický a Google zavedli modely, které jsou obzvláště dobré při psaní kódu.

Příchod GPT-4.1 se široce říkal několik týdnů. OpenAI zřejmě testoval model na některých populárních žebříčku pod pseudonymem Alpha Quasar, říkají zdroje. Někteří uživatelé modelu „Stealth“ vykázali působivé schopnosti kódování. „Quasar vyřešil všechny otevřené problémy, které jsem měl s jiným genovým kódem. [sic] Přes LLMS, který byl neúplný, “napsal jedna osoba na Reddit.

Všechny nové modely mohou analyzovat osmkrát více kódu najednou, což zlepšuje jejich schopnost provádět vylepšení a opravit chyby. Nové modely jsou také lepší při následujících pokynech daných uživateli, což snižuje potřebu opakovat příkazy různými způsoby, aby získala požadovaný výsledek. OpenAi ukázal ukázky GPT-4.1 Budování různých aplikací, včetně aplikace pro karta flashcard pro výuku jazyků.

„Vývojáři se hodně starají o kódování a my jsme zlepšovali schopnost našeho modelu psát funkční kód,“ uvedla Michelle Pokrass, která pracuje na post tréninku v OpenAI, během pondělního živého přenosu. „Pracovali jsme na tom, aby to následovalo různé formáty a lépe prozkoumával repozice, provádějící testy jednotek a psaní kódu, který kompiluje.“

GPT-4,1 je o 40 procent rychlejší než GPT.4o, nejpoužívanější model OpenAI pro vývojáře. Náklady na zadávání dotazů uživatelů byly v této nejnovější verzi sníženy o 80 procent, říká OpenAI.

Na dnešním živém proudu Varun Mohan, generální ředitel Windsurf, oblíbený nástroj pro kódování AI, uvedl, že společnost testovala GPT-4.1 a zjistila, že nový model byl „60 procent“ lepší než GPT-4o podle svých vlastních benchmarků. „Zjistili jsme, že GPT-4.1 má podstatně méně případů degenerovaného chování,“ řekl Mohan a poznamenal, že nový model tráví omylem méně času čtením a úpravou irelevantních souborů.

Během posledních několika let má OpenAI OpenAIed horečnatý zájem o Chatgpt, pozoruhodný chatbot, který se poprvé představil na konci roku 2022, do rostoucího podnikání prodávajícího přístup k pokročilejším chatbotům a modelům AI. V rozhovoru s TED minulý týden Altman uvedl, že OpenAI má 500 milionů aktivních uživatelů týdeníku a že použití „roste velmi rychle“.





Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com