V roce 2025 uvidíme, jak umělá inteligence a strojové učení využívají k dosažení skutečného pokroku v chápání komunikace se zvířaty a odpoví na otázku, která mátla lidi, dokud existujeme: „Co si zvířata říkají? Nedávná Coller-Dolittle Prize, která nabízí peněžní ceny až do výše půl milionu dolarů pro vědce, kteří „rozluští kód“, je známkou býčí důvěry, že nedávný technologický vývoj v oblasti strojového učení a velkých jazykových modelů (LLM) to umísťuje. cíl v našem dosahu.
Mnoho výzkumných skupin pracovalo roky na algoritmech, které by dávaly smysl zvukům zvířat. Projekt Ceti například dekódoval klikací vlaky vorvaňů a písně keporkaků. Tyto moderní nástroje strojového učení vyžadují extrémně velké množství dat a až dosud takové množství vysoce kvalitních a dobře anotovaných dat chybělo.
Zvažte LLM, jako je ChatGPT, které mají k dispozici tréninková data, která zahrnují veškerý text dostupný na internetu. Takové informace o komunikaci zvířat nebyly v minulosti dostupné. Nejde jen o to, že korpusy lidských dat jsou o mnoho řádů větší než druh dat, ke kterým máme přístup pro zvířata ve volné přírodě: K trénování GPT-3 bylo použito více než 500 GB slov ve srovnání s více než 8 000 „codas“. “ (nebo vokalizace) pro nedávnou analýzu komunikace vorvaně Project Ceti.
Navíc při práci s lidskou řečí již vědět co se říká. Dokonce víme, co tvoří „slovo“, což je obrovská výhoda oproti interpretaci zvířecí komunikace, kde vědci jen zřídka vědí, zda například konkrétní vlčí vytí znamená něco jiného než vytí jiného vlka, nebo dokonce, zda vlci považují vytí za nějak analogicky k „slovu“ v lidské řeči.
Rok 2025 však přinese nové pokroky, a to jak v množství dat o komunikaci se zvířaty, která jsou vědcům k dispozici, tak v typech a síle algoritmů umělé inteligence, které lze na tato data aplikovat. Automatizované nahrávání zvuků zvířat bylo snadno dostupné pro každou vědeckou výzkumnou skupinu, přičemž popularita levných nahrávacích zařízení, jako je AudioMoth, explodovala.
Obrovské datové sady jsou nyní online, protože rekordéry mohou být ponechány v terénu a poslouchat volání gibonů v džungli nebo ptáků v lese, 24 hodin denně 7 dní v týdnu, po dlouhou dobu. Byly případy, kdy nebylo možné tak masivní datové soubory spravovat ručně. Nyní mohou nové automatické detekční algoritmy založené na konvolučních neuronových sítích proběhnout tisíce hodin nahrávek, vybrat zvuky zvířat a seskupovat je do různých typů podle jejich přirozených akustických charakteristik.
Jakmile budou k dispozici tyto velké soubory údajů o zvířatech, stanou se možností nové analytické algoritmy, jako je použití hlubokých neuronových sítí k nalezení skryté struktury v sekvencích zvířecích vokalizací, které mohou být analogické smysluplné struktuře v lidském jazyce.
Základní otázkou, která však zůstává nejasná, je, co přesně s těmito zvířecími zvuky doufáme? Některé organizace, jako je Interspecies.io, stanovily svůj cíl zcela jasně jako „převést signály z jednoho druhu na koherentní signály pro jiný“. Jinými slovy, aby přeložit komunikace zvířat do lidské řeči. Přesto většina vědců souhlasí s tím, že nelidská zvířata nemají svůj vlastní jazyk – alespoň ne tak, jako máme jazyk my lidé.
Cena Coller Dolittle Prize je o něco sofistikovanější a hledá způsob, jak „komunikovat nebo dešifrovat komunikaci organismu“. Rozluštění je o něco méně ambiciózní cíl než překládání, vezmeme-li v úvahu možnost, že zvířata ve skutečnosti nemusí mít jazyk, který by bylo možné přeložit. Dnes nevíme, kolik informací nebo jak málo si zvířata mezi sebou předávají. V roce 2025 bude mít lidstvo potenciál přeskočit naše chápání nejen toho, kolik toho zvířata říkají, ale také toho, co přesně si říkají navzájem.
Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com