Amazonka oznámila novou rodinu hraničních modelů umělé inteligence – a nový způsob, jak si zákazníci mohou vytvářet vlastní hraniční modely.
Elektronický gigant oznámil druhou generaci svých modelů Nova AI na re:Invent, firemní konferenci konané v Las Vegas. Modely nejsou zdaleka tak populární jako modely nabízené konkurenty, jako je OpenAI a Google, ale plán Amazonu, aby byly vysoce přizpůsobitelné, by je mohl získat u uživatelů cloudu.
Amazon podrobně popsal dva vylepšené velké jazykové modely, Nova Lite a Nova Pro, nový hlasový model v reálném čase nazvaný Nova Sonic a experimentálnější model s názvem Nova Omni, který provádí simulovaný druh uvažování pomocí obrázků, zvuku a videa i textu. Nové modely jsou dnes dostupné omezenému počtu zákazníků.
Ještě důležitější je, že vzhledem k důležitosti svého cloudového podnikání Amazon vydává nástroj nazvaný Nova Forge, který zákazníkům umožní vytvářet specializované hraniční modely přidáním vlastních tréninkových dat k nedokončeným verzím modelů Nova 2 Lite a Pro.
Již nyní je možné vyladit běžné modely umělé inteligence, jako jsou Gemini od Googlu a GPT od OpenAI. Přístup Amazonu však umožňuje zákazníkům přidávat data v různých fázích modelového školení, včetně procesu vytváření základního modelu, což je fáze známá jako vlastní předtrénink, která je běžně vyhrazena pro velké laboratoře AI.
„Každý hledá hraniční model, který je expertem ve své oblasti,“ řekl před dnešními oznámeními WIRED Rohit Prasad, který vede úsilí Amazonu o AI. Prasad říká, že Amazon vyvinul technologie za Nova Forge, aby posílil interní týmy, včetně těch, které vyvíjejí agenty Alexa a AI pro vytváření vlastních modelů. „Toto je v podstatě nové otevřené tréninkové paradigma,“ říká.
Jedním ze zákazníků, který tento přístup testoval, je Reddit, který použil Nova Forge k vytvoření vlastního modelu k identifikaci obsahu, který porušuje pravidla platformy.
Jemné doladění konvenčního modelu by nefungovalo, říká šéf technologie Reddit Chris Slowe, protože většina modelů je navržena tak, aby se zcela vyhnula urážlivému nebo násilnému obsahu, což znamená, že by odmítly analyzovat některé materiály. Slowe říká, že vlastní předškolení v kombinaci s konvenčním doladěním vytvořilo hraniční model, který je odborníkem na pochopení a používání Redditu.
„Ostatní LLM chápou Reddit jako koncept a to, jak Reddit funguje, ale nejsou v háji,“ říká Slowe. „Opravdu jsme vytvořili expertní model Reddit.“
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com