Nová skupina se snaží učinit licencování dat AI etické







První vlna hlavních generativních nástrojů umělé inteligence byla z velké části trénována na „veřejně dostupných“ datech – v podstatě na čemkoli a na všem, co lze seškrábat z internetu. Nyní zdroje školicích dat stále více omezují přístup a tlačí na licenční smlouvy. Se zintenzivněním hledání dalších zdrojů dat se objevily nové licenční startupy, které udržely tok zdrojového materiálu.

Dataset Providers Alliance, obchodní skupina založená letos v létě, chce učinit průmysl AI standardizovanějším a spravedlivějším. Za tímto účelem právě vydala poziční dokument, který nastiňuje její postoje k hlavním problémům souvisejícím s AI. Alianci tvoří sedm licenčních společností pro umělou inteligenci, včetně společnosti Rightsify pro správu hudebních a autorských práv, japonského tržiště s fotografiemi Pixta a start-upu Calliope Networks, který licencuje generativní autorská práva. (Na podzim bude oznámeno nejméně pět nových členů.)

DPA prosazuje systém opt-in, což znamená, že údaje lze používat pouze po výslovném souhlasu tvůrců a držitelů práv. To představuje významný odklon od způsobu, jakým většina velkých společností využívajících umělou inteligenci funguje. Některé vyvinuly své vlastní systémy opt-out, které zatěžují vlastníky dat, aby svou práci přebírali případ od případu. Jiné nenabízejí žádné možnosti odhlášení.

DPA, která očekává, že členové budou dodržovat její pravidlo opt-in, považuje tuto cestu za mnohem etičtější. „Umělci a tvůrci by měli být na palubě,“ říká Alex Bestall, generální ředitel Rightsify a licenční společnosti pro hudební data Global Copyright Exchange, který stál v čele tohoto úsilí. Bestall považuje opt-in za pragmatický i morální přístup: „Prodej veřejně dostupných datových sad je jedním ze způsobů, jak být žalován a nedůvěryhodný.“

Ed Newton-Rex, bývalý výkonný ředitel pro umělou inteligenci, který nyní provozuje etickou neziskovou organizaci pro umělou inteligenci Fairly Trained, nazývá odhlášení „zásadně nespravedlivé vůči tvůrcům“ a dodává, že někteří možná ani nevědí, kdy jsou odhlášení nabízeny. „Je obzvláště dobré vidět, že DPA volá po opt-inech,“ říká.

Shayne Longpre, vedoucí iniciativy Data Provenance Initiative, dobrovolnického kolektivu, který provádí audit datových sad AI, považuje úsilí DPA o získávání dat eticky za obdivuhodné, i když má podezření, že standard pro opt-in by mohl být náročný na prodej kvůli obrovskému objemu dat. data, která většina moderních modelů umělé inteligence vyžaduje. „V tomto režimu buď budete mít nedostatek dat, nebo budete hodně platit,“ říká. „Mohlo by se stát, že pouze několik hráčů, velkých technologických společností, si může dovolit licencovat všechna tato data.“

V dokumentu DPA vystupuje proti vládou nařízenému licencování a místo toho argumentuje přístupem „volného trhu“, ve kterém přímo vyjednávají původci dat a společnosti AI. Další pokyny jsou podrobnější. Aliance například navrhuje pět potenciálních kompenzačních struktur, které zajistí, že tvůrci a držitelé práv budou za svá data náležitě placeni. Patří mezi ně model založený na předplatném, „licencování založené na použití“ (ve kterém se platí poplatky za použití) a licencování „založené na výsledcích“, ve kterém jsou licenční poplatky vázány na zisk. „Ty by mohly fungovat pro cokoli, od hudby přes obrázky až po film a televizi nebo knihy,“ říká Bestall.





Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com