Když byl ChatGPT vydán v listopadu 2023, bylo možné k němu přistupovat pouze prostřednictvím cloudu, protože model za ním byl přímo obrovský.
Dnes mi běží podobně schopný AI program na Macbooku Air a není ani teplý. Zmenšení ukazuje, jak rychle výzkumníci zdokonalují modely umělé inteligence, aby byly štíhlejší a efektivnější. Ukazuje také, že přechod na stále větší měřítka není jediným způsobem, jak učinit stroje výrazně chytřejšími.
Model, který nyní naplňuje můj notebook vtipem a moudrostí jako ChatGPT, se nazývá Phi-3-mini. Je součástí rodiny menších modelů umělé inteligence, které nedávno vydali výzkumníci z Microsoftu. I když je dostatečně kompaktní, aby jej bylo možné spustit na chytrém telefonu, testoval jsem jej spuštěním na notebooku a přístupem k němu z iPhone prostřednictvím aplikace s názvem Enchanted, která poskytuje rozhraní chatu podobné oficiální aplikaci ChatGPT.
V článku popisujícím rodinu modelů Phi-3 výzkumníci Microsoftu říkají, že model, který jsem použil, se příznivě vyrovná GPT-3.5, modelu OpenAI, který stojí za prvním vydáním ChatGPT. Toto tvrzení je založeno na měření jeho výkonu na několika standardních benchmarkech umělé inteligence navržených k měření zdravého rozumu a uvažování. V mém vlastním testování se rozhodně jeví stejně schopný.
Společnost Microsoft tento týden na své výroční vývojářské konferenci Build oznámila nový „multimodální“ model Phi-3 schopný zpracovávat zvuk, video a text. Stalo se to jen několik dní poté, co OpenAI a Google nabídly radikální nové asistenty AI postavené na multimodálních modelech přístupných přes cloud.
Rodina liliputánských modelů umělé inteligence společnosti Microsoft naznačuje, že začíná být možné vytvářet všechny druhy praktických aplikací umělé inteligence, které nejsou závislé na cloudu. To by mohlo otevřít nové případy použití tím, že jim umožníte lépe reagovat nebo být soukromé. (Offline algoritmy jsou klíčovou součástí funkce Recall, kterou Microsoft oznámil, která využívá AI k tomu, aby bylo možné prohledávat vše, co jste kdy dělali na svém PC.)
Rodina Phi ale také odhaluje něco o povaze moderní umělé inteligence a možná, jak ji lze vylepšit. Sébastien Bubeck, výzkumný pracovník společnosti Microsoft zapojený do projektu, mi řekl, že modely byly vytvořeny, aby otestovaly, zda větší selektivita v tom, na co je systém AI trénován, může poskytnout způsob, jak vyladit jeho schopnosti.
Velké jazykové modely, jako je OpenAI GPT-4 nebo Google Gemini, které pohánějí chatboty a další služby, jsou obvykle lžící krmené obrovské hromady textu vysávané z knih, webových stránek a téměř jakéhokoli jiného dostupného zdroje. Ačkoli to vyvolalo právní otázky, OpenAI a další zjistili, že zvýšení množství textu dodávaného do těchto modelů a množství výkonu počítače používaného k jejich trénování může odemknout nové schopnosti.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com