Prodej uživatelských dat na Redditu pro školení AI přitahuje vyšetřování FTC

Reddit řekl dopředu z jeho IPO příští týden, že licencování uživatelských příspěvků pro Google a další pro projekty AI by mohlo v příštích několika letech přinést příjmy ve výši 203 milionů dolarů. Komunitně řízená platforma byla v pátek nucena prozradit, že američtí regulátoři již mají otázky ohledně tohoto nového oboru podnikání.

Reddit v regulačním podání uvedl, že ve čtvrtek obdržel dopis od americké Federální obchodní komise s dotazem na „náš prodej, licencování nebo sdílení obsahu vytvořeného uživateli s třetími stranami za účelem školení modelů umělé inteligence“.

FTC, hlavní antimonopolní regulátor vlády USA, má pravomoc sankcionovat společnosti, u kterých se zjistí, že se zapojují do nekalých nebo klamavých obchodních praktik. Myšlenka licencování obsahu vytvářeného uživateli pro projekty umělé inteligence vyvolala u zákonodárců a skupin na ochranu práv otázky ohledně rizik ochrany soukromí, spravedlnosti a autorských práv.

Reddit není sám, kdo se snaží vydělat peníze na licenčních datech, včetně dat generovaných uživateli, pro AI. Stránka pro otázky a odpovědi o programování Stack Overflow podepsal smlouvu se společností Google, Associated Press podepsal smlouvu s OpenAI a vlastník Tumblr Automattic uvedl, že spolupracuje „s vybranými společnostmi v oblasti umělé inteligence“, ale umožní uživatelům odhlásit se z předávání jejich dat. . Žádný z poskytovatelů licencí okamžitě nereagoval na žádosti o vyjádření. Reddit také není jedinou společností, která obdržela dopis FTC o licencování dat, uvedl v pátek Axios s odkazem na nejmenovaného bývalého úředníka agentury.

Není jasné, zda dopis na Reddit přímo souvisí s přezkoumáním do jiných společností.

Reddit v pátečním zveřejnění uvedl, že se nedomnívá, že by se účastnil nějakých nekalých nebo klamavých praktik, ale varoval, že vyřizování jakéhokoli vládního šetření může být nákladné a časově náročné. „V dopise bylo uvedeno, že zaměstnanci FTC mají zájem se s námi setkat, aby se dozvěděli více o našich plánech, a že FTC má v úmyslu vyžádat si od nás informace a dokumenty, protože její vyšetřování pokračuje,“ uvádí se v podání. Reddit uvedl, že dopis FTC popsal kontrolu jako související s „neveřejným šetřením“.

Reddit, jehož 17 miliard příspěvků a komentářů považují odborníci na AI za cenné pro školení chatbotů v umění konverzace, minulý měsíc oznámilo dohodu o licenci obsahu společnosti Google. Reddit a Google okamžitě nereagovaly na žádosti o komentář. FTC to odmítla komentovat.

Chatboti s umělou inteligencí, jako je ChatGPT od OpenAI a Gemini od Googlu, jsou považováni za konkurenční hrozbu pro Reddit, vydavatele a další podniky založené na reklamě a obsahu. V minulém roce se vyhlídka na licencování dat vývojářům umělé inteligence pro některé společnosti ukázala jako potenciální výhoda generativní umělé inteligence.

Ale použití dat shromážděných online k trénování modelů umělé inteligence vyvolalo řadu otázek, které se vinou zasedacími síněmi, soudními síněmi a Kongresem. Pro Reddit a další, jejichž data jsou generována uživateli, tyto otázky zahrnují, kdo skutečně vlastní obsah a zda je spravedlivé licencovat jej, aniž by to tvůrce zasáhlo. Bezpečnostní výzkumníci zjistili, že modely umělé inteligence mohou unikat osobní data obsažená v materiálu použitém k jejich vytvoření. A někteří kritici se domnívají, že tyto dohody by mohly učinit mocné společnosti ještě dominantnějšími.

Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com