Proč je AI tak špatná při generování obrázků Kamala Harris?







Když Elon Musk sdílel obrázek, který ukazuje Kamala Harris oblečená jako „komunistický diktátor“ na X minulý týden to byl zcela zjevně padělek, protože Harris není ani komunista, ani, pokud je nám známo, sovětský cosplayer. A jak mnoho pozorovatelů poznamenalo, žena na fotografii, pravděpodobně vytvořená nástrojem Grok společnosti X, měla s viceprezidentem pouze letmou podobnost.

„AI stále nedokáže přesně zobrazit Kamalu Harris,“ napsal jeden uživatel X. „Vypadá to, že vysílají nějakou náhodnou latino ženskou.“

„Grok oblékl starou Evu Longorii do elegantního oblečení a nazval to dnem,“ vtipkoval další a všiml si podobnosti „diktátora“ na obrázku. Zoufalé manželky hvězda.

„AI prostě NEMŮŽE replikovat Kamalu Harris,“ napsal třetí. „Je neuvěřitelné, jak selhal algoritmus u AMERICANŮ (jihoindického a jamajského dědictví).“

Mnoho AI obrázků Harrise je podobně špatných. Tweet s Video generované AI ukazuje Harris a Donald Trump v romantickém vztahu – to vyvrcholí tím, že drží jejich milované dítě, které vypadá jako Trump – má téměř 28 milionů zhlédnutí na X. V průběhu sestřihu se Harris proměňuje v to, co vypadá jako různí lidé, zatímco výrazně lepší Trump snímky zůstávají poměrně konzistentní.

Když jsme se pokusili pomocí Groka vytvořit fotografii Harrise a Trumpa, kteří odložili své rozdíly stranou, abychom si přečetli kopii WIRED, výsledky opakovaně zobrazovaly exprezidenta přesně, zatímco Harris se mýlil. Viceprezident se objevil s různými rysy, účesy a odstíny pleti. Při několika příležitostech vypadala spíše jako bývalá první dáma Michelle Obamová.

Grok se liší od některých vysoce profilovaných generátorů obrázků AI v tom, že uživatelům umožňuje vytvářet falešné fotografie politických osobností. Začátkem tohoto roku začala Midjourney svým uživatelům blokovat vytváření obrázků Trumpa a prezidenta Joea Bidena. (Zákaz se vztahuje i na Harrise.) Tento krok následoval po zveřejnění zprávy Centra pro boj proti digitální nenávisti, která zjistila, že tento nástroj lze použít k vytvoření řady politicky nabitých obrázků.

Podobně ChatGPT od OpenAI a Gemini od Googlu odmítly vytvořit snímky Harrise nebo Trumpa při testování WIRED. Mezitím bude řada generátorů obrázků s otevřeným zdrojovým kódem, stejně jako Grok, vytvářet obrázky politiků. WIRED našel jeden takový model, Stable Diffusion, také produkoval nepříliš skvělé obrázky Harrise.

Moderní generátory obrázků AI používají k generování obrázků z textových výzev takzvané modely difúze. Tyto modely obsahují mnoho tisíc označených obrázků, obvykle seškrábaných z webu nebo shromážděných z jiných zdrojů. Joaquin Cuenca Abela, generální ředitel společnosti Freepik, která je hostitelem různých nástrojů umělé inteligence, včetně několika generátorů obrázků, říká WIRED, že problém, který takové generátory vykouzlí Harrise, ve srovnání s Trumpem, je ten, že se jim dostalo méně dobře označených obrázků.

Přestože je Harris prominentní postavou, nebyl tak široce fotografován jako Trump. Hledání dodavatele fotografií Getty Images společnosti WIRED to potvrzuje; vrátilo 63 295 snímků Harrise ve srovnání s 561 778 snímky Trumpa. Vzhledem k jejímu relativně nedávnému vstupu do prezidentského klání je Harris „nová celebrita“, pokud jde o tvůrce obrázků AI, podle Cuenca Abela. „Vždy to trvá několik měsíců, než to doženeme,“ říká.







Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com