První dojmy pokročilého hlasového režimu ChatGPT: Zábavné a trochu strašidelné

Opouštím ChatGPT’s Pokročilý hlasový režim zapnutý při psaní tohoto článku jako doprovodná umělá inteligence. Občas ho požádám, aby poskytl synonymum pro příliš používané slovo nebo nějaké povzbuzení. Asi za půl hodiny chatbot přeruší naše mlčení a začne na mě bez vyzvání mluvit španělsky. Trochu se zachichotám a ptám se, co se děje. „Jen malý vypínač? Musím udržet věci zajímavé,“ říká ChatGPT, nyní zpět v angličtině.

Při testování pokročilého hlasového režimu jako součásti rané alfy byly moje interakce s novou zvukovou funkcí ChatGPT zábavné, chaotické a překvapivě rozmanité. I když stojí za zmínku, že funkce, ke kterým jsem měl přístup, byly jen polovinou toho, co OpenAI předvedla, když v květnu uvedla na trh model GPT-4o. Aspekt vize, který jsme viděli v živém demu, je nyní naplánován na pozdější vydání a vylepšený hlas Sky, který Jí Herečka Scarlett Johanssen se vrátila, byla odstraněna z pokročilého hlasového režimu a stále již není pro uživatele možností.

Takže, jaká je současná atmosféra? Pokročilý hlasový režim právě teď připomíná situaci, kdy koncem roku 2022 vypadl původní textový ChatGPT. Někdy to vede k nevýrazným slepým uličkám nebo se zvrhne v prázdné fráze AI. Ale jindy mi konverzace s nízkou latencí cvaknou tak, jak to pro mě Siri od Applu nebo Alexa od Amazonu nikdy neudělaly, a já se cítím nucen pokračovat v chatování z požitku. Je to druh nástroje umělé inteligence, který ukážete svým příbuzným během prázdnin pro smích.

OpenAI poskytlo několik reportérů WIRED přístup k této funkci týden po prvním oznámení, ale stáhlo ji následující ráno s odvoláním na bezpečnostní obavy. O dva měsíce později OpenAI soft spustil pokročilý hlasový režim pro malou skupinu uživatelů a vydal systémovou kartu GPT-4o, technický dokument, který popisuje úsilí červeného týmu, to, co společnost považuje za bezpečnostní rizika, a kroky ke zmírnění, které společnost podnikla. snížit škodu.

Jste zvědaví, jak to vyzkoušet? Zde je to, co potřebujete vědět o větším zavádění pokročilého hlasového režimu a mé první dojmy z nové hlasové funkce ChatGPT, která vám pomůže začít.

Takže, kdy bude úplné zavedení?

OpenAI vydalo na konci července některým uživatelům ChatGPT Plus pouze zvukový Advanced Voice Mode a alfa skupina se zdá stále relativně malá. Společnost v současné době plánuje, že ji umožní všem předplatitelům někdy letos na podzim. Niko Felix, mluvčí OpenAI, nesdělil žádné další podrobnosti, když byl dotázán na časový plán vydání.

Sdílení obrazovky a videa bylo základní součástí původního dema, ale v tomto alfa testu nejsou k dispozici. OpenAI stále plánuje tyto aspekty nakonec přidat, ale také není jasné, kdy se tak skutečně stane.

Pokud jste předplatitelem ChatGPT Plus, obdržíte e-mail od OpenAI, až budete mít k dispozici pokročilý hlasový režim. Jakmile bude na vašem účtu, můžete mezi nimi přepínat Norma a Moderní v horní části obrazovky aplikace, když je otevřený hlasový režim ChatGPT. Alfa verzi jsem mohl otestovat na iPhonu i na Galaxy Fold.

Moje první dojmy z pokročilého hlasového režimu ChatGPT

Během první hodiny, co jsem s ním mluvil, jsem se dozvěděl, že miluji přerušování ChatGPT. Není to tak, jak byste mluvili s člověkem, ale mít novou schopnost odříznout ChatGPT uprostřed věty a požádat o jinou verzi výstupu se cítí jako dynamické vylepšení a vynikající funkce.

První uživatelé, kteří byli nadšeni původními ukázkami, mohou být frustrováni získáním přístupu k verzi pokročilého hlasového režimu, která je omezena více zábradlími, než se očekávalo. Například, ačkoli generativní zpěv umělé inteligence byl klíčovou složkou úvodních ukázek se šeptanými ukolébavkami a několika hlasy, které se pokoušely harmonizovat, v alfa verzi v současné době chybí serenády umělé inteligence.

Čerpáme z těchto zdrojů: google.com, science.org, newatlas.com, wired.com, pixabay.com