Poprvé AI analyzuje jazyk stejně dobře jako lidský expert



Původní verze z tento příběh se objevil v Časopis Quanta.

Které z nesčetných schopností, které lidé mají, jsou jedinečně lidské? Jazyk byl hlavním kandidátem přinejmenším od Aristotela, který napsal, že lidstvo je „zvíře, které má jazyk“. I když velké jazykové modely, jako je ChatGPT, povrchně replikují běžnou řeč, vědci chtějí vědět, zda existují specifické aspekty lidského jazyka, které prostě nemají obdoby v komunikačních systémech jiných zvířat nebo uměle inteligentních zařízeních.

Výzkumníci zejména zkoumali, do jaké míry mohou jazykové modely uvažovat o jazyce samotném. Pro některé v lingvistické komunitě nejen jazykové modely ne mají rozumové schopnosti, oni nemůže. Tento pohled shrnul Noam Chomsky, významný lingvista, a dva spoluautoři v roce 2023, když napsali v roce 2023 The New York Times že „správná vysvětlení jazyka jsou komplikovaná a nelze se je naučit pouhým marinováním ve velkých datech“. Tito výzkumníci tvrdili, že modely umělé inteligence mohou být zběhlé v používání jazyka, ale nejsou schopny analyzovat jazyk sofistikovaným způsobem.

Obrázek může obsahovat Kniha Publikace vnitřní knihovny Nábytek pro dospělé Knihovna Obličej a hlava

Gašper Beguš, lingvista na University of California, Berkeley.

Fotografie: Jami Smith

Tento názor byl zpochybněn v nedávném článku Gašpera Beguše, lingvisty z Kalifornské univerzity v Berkeley; Maksymilian Dąbkowski, který nedávno získal doktorát z lingvistiky na Berkeley; a Ryan Rhodes z Rutgers University. Výzkumníci podrobili řadu velkých jazykových modelů, neboli LLM, škálou lingvistických testů – včetně v jednom případě, kdy LLM zobecnil pravidla vytvořeného jazyka. Zatímco většina LLM nedokázala analyzovat lingvistická pravidla tak, jak jsou schopni lidé, jeden měl působivé schopnosti, které výrazně předčily očekávání. Dokázala analyzovat jazyk v podstatě stejným způsobem, jakým by to udělal postgraduální student lingvistiky – diagramy vět, řešení více nejednoznačných významů a využití komplikovaných lingvistických rysů, jako je rekurze. Toto zjištění, řekl Beguš, „zpochybňuje naše chápání toho, co umělá inteligence dokáže“.

Tato nová práce je aktuální a „velmi důležitá“, řekl Tom McCoy, počítačový lingvista z Yale University, který se na výzkumu nepodílel. „S tím, jak se společnost stává na této technologii stále závislejší, je stále důležitější pochopit, kde může uspět a kde selhat.“ Dodal, že lingvistická analýza je ideálním testovacím prostředím pro hodnocení míry, do jaké tyto jazykové modely dokážou uvažovat jako lidé.

Nekonečná složitost

Jednou z výzev, jak dát jazykovým modelům přísný lingvistický test, je ujistit se, že ještě neznají odpovědi. Tyto systémy jsou obvykle trénovány na obrovském množství písemných informací – nejen na většině internetu v desítkách, ne-li stovkách jazyků, ale také na věcech, jako jsou učebnice lingvistiky. Modely by si teoreticky mohly jednoduše zapamatovat a znovu vyvolat informace, které dostaly během tréninku.

Aby se tomu Beguš vyhnul, vytvořili se svými kolegy lingvistický test ve čtyřech částech. Tři ze čtyř částí zahrnovaly požadavek, aby model analyzoval speciálně vytvořené věty pomocí stromových diagramů, které byly poprvé představeny v Chomského významné knize z roku 1957, Syntaktické struktury. Tyto diagramy rozdělují věty na podstatná a slovesná spojení a dále je rozdělují na podstatná jména, slovesa, přídavná jména, příslovce, předložky, spojky a tak dále.

Jedna část testu byla zaměřena na rekurzi – schopnost vkládat fráze do frází. „Nebe je modré“ je jednoduchá anglická věta. „Jane řekla, že nebe je modré“ vkládá původní větu do trochu složitější věty. Důležité je, že tento proces rekurze může pokračovat donekonečna: „Maria přemýšlela, jestli Sam věděl, že Omar slyšel, že Jane řekla, že nebe je modré“ je také gramaticky správná, i když trapná, rekurzivní věta.


Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com

Holky na privát z celé ČR najdete na NaPrivat.net Recenze na sexuální služby v ČR - Noření.cz
DotekSlova.cz NaPrivat.net