OpenAI dáva ChatGPT hlas na odpovedanie na výzvy a príkazy

Čitatelia ako vy pomáhajú podporovať MUO. Keď uskutočníte nákup pomocou odkazov na našej stránke, môžeme získať pridruženú províziu. Čítaj viac.

ChatGPT sa má stať interaktívnym generatívnym zážitkom AI. OpenAI odhalilo, že popredný svetový chatbot s umelou inteligenciou bude schopný hovoriť a odpovedať na otázky používateľov pomocou syntetizovaného, pravdepodobne generovaného hlasu.

Spolu so svojím novo nájdeným hlasom bude ChatGPT tiež schopný reagovať a diskutovať o konkrétnych obrázkoch, ktoré sú doň nahrané alebo zachytené počas používania aplikácie ChatGPT pre Android alebo iOS. Funkcia rozpoznávania obrázkov znie podobne ako Google Lens a ďalšie aplikácie, ktoré používajú neurónové siete na presné zisťovanie údajov a informácií.

ako môžem zadarmo zistiť, komu patrí telefónne číslo?

OpenAI dáva ChatGPT hlas

25. septembra 2023 vývojár ChatGPT OpenAI odhalený dal by hlas svojmu poprednému svetovému generatívnemu chatbotovi AI. Používatelia ChatGPT môžu hovoriť priamo s chatbotom a požiadať ho o spätné vyjadrenie, čo efektívne umožňuje ChatGPT prvýkrát konverzovať priamo hlasom.

V ukážkovom klipe OpenAI je žena, ktorá žiada ChatGPT, aby vytvorila jedinečný príbeh pred spaním, na ktorý ChatGPT náležite odpovie ženským syntetizovaným hlasom.

Podľa Drôtové , nový model prevodu textu na reč bol vyvinutý interne. Dokáže generovať „ľudský“ zvuk z textu a niekoľkých sekúnd ukážkovej reči ( pomocou modelu OpenAI Whisper ) a hovoria rôznymi tónmi a štýlmi. Celý rad hlasových ukážok nájdete na Blog OpenAI .

Niektoré spoločnosti už používajú nový hlasový model OpenAI. Napríklad Spotify používa model prevodu textu na reč OpenAI na preklad podcastov do rôznych jazykov, pričom kombinuje schopnosť prekladu jazyka ChatGPT s jeho novou schopnosťou hovoriť.

Nový model prevodu textu na reč ChatGPT je k dispozícii iba pre predplatiteľov Plus a Enterprise, ktorí používajú oficiálne aplikácie pre Android a iOS a očakáva sa, že bude uvedený na trh v priebehu nasledujúcich dvoch týždňov (od 25. septembra 2023). Okrem toho je nová funkcia hlasu na začiatku obmedzená na angličtinu, aj keď by sme očakávali, že sa to rýchlo zmení.

ChatGPT dokáže rozpoznať a fotografie

Druhou časťou aktualizácie ChatGPT OpenAI je schopnosť analyzovať a rozprávať obrázky nahrané do nástroja. Možnosť vizuálnej analýzy obrazu bola uvedená v aktualizačných videách GPT-4, ale odvtedy sa o nej veľa nediskutovalo ( Interpret kódu ChatGPT stranou ).

ChatGPT teraz získava funkcie podobné Google Lens. Môžete nahrať obrázok do ChatGPT alebo odfotografovať pomocou fotoaparátu smartfónu v aplikácii ChatGPT, ktorý detailne obrázok rozšíri a v prípade potreby pridá ďalší kontext.

web, ktorý vás zavedie na náhodné webové stránky

Nazvať to „podobné ako Google Lens“ je skutočne nespravodlivé. Schopnosť chatovať tam a späť o obrázku s cieľom získať viac informácií a kontextu ho robí mimoriadne užitočným pre širokú škálu nastavení. Je však dôležité si všimnúť drobné písmo, pričom OpenAI objasňuje, že má obmedzenú „schopnosť ChatGPT analyzovať a robiť priame vyhlásenia o ľuďoch“ z dôvodov ochrany súkromia a presnosti. Mohol by však nástroj „Who Is This“ založený na OpenAI v budúcnosti fungovať? (Dúfajme, že nie!)

Rovnako ako nový model prevodu textu na reč, OpenAI zavedie rozpoznávanie obrázkov v najbližších dvoch týždňoch, aj keď bude k dispozícii na všetkých platformách, nielen na aplikácii ChatGPT.

Súkromie, bezpečnosť a ďalšie problémy

Dôsledky hlasového ChatGPT sú výrazné. Iste, je to vzrušujúce. Schopnosť vytvoriť jedinečne syntetizovaný hlas pomocou príkladu krátkeho úryvku však prináša značné problémy so súkromím a bezpečnosťou. Potenciál zlomyseľných aktérov využiť tieto nástroje je obrovský a ako pri každom generatívnom nástroji AI, akonáhle je džin vonku z fľaše, už sa doňho absolútne nevráti. Žiadne množstvo regulácie umelej inteligencie od vlád alebo myšlienkových lídrov sa nemôže vrátiť späť. vlna.

prečo iTunes nerozpozná môj iphone

Zdá sa, že dokonca aj varovanie OpenAI na túto tému obchádza to, čo je zrejmé, napriek spomenutiu problémov:

Tieto schopnosti však predstavujú aj nové riziká, ako napríklad možnosť, že sa zlomyseľní aktéri budú vydávať za verejné osobnosti alebo spáchať podvod. To je dôvod, prečo túto technológiu používame na podporu konkrétneho prípadu použitia – hlasového chatu.

Vzhľadom na to, že toto je špička ľadovca, očakávajte odvolanie proti novoobjavenému hlasu ChatGPT, najmä ak dôjde k predvídateľnému nárastu nepríjemných titulkov, ktoré tvrdia, že ChatGPT sa používa na páchanie podvodov atď.

OpenAI robí z ChatGPT aplikáciu Go-To AI

Čím viac OpenAI pridáva do ChatGPT užívateľsky prívetivé funkcie, tým viac sa stáva generatívnou aplikáciou AI. ChatGPT, ako prvá, ktorá dosiahla všeobecnú slávu počas počiatočného generatívneho boomu AI, stále vedie a je jedinou aplikáciou, ktorú možno použiť, a to aj napriek konkurencii takých, ako sú Google Bard (a potenciálne Google Gemini) a Claude od Anthropic.

Pokiaľ bude OpenAI pokračovať v pridávaní funkcií, ktoré uľahčujú používanie ChatGPT, udrží ľudí v napätí a bude sa stále viac približovať k svojmu cieľu, ktorým je skutočne multimodálny nástroj AI.