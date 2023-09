Jeden z piatich hlasov chatbota pripomína známu herečku.

Generálny riaditeľ OpenAI Sam Altman na vypočutí v americkom Senáte. (Zdroj: Jabin Botsford — The Washington Post)

Text vyšiel pôvodne v denníku The Washington Post.

Spoločnosť OpenAI oznámila, že svojmu chatbotovi ChatGPT dáva možnosť rozprávať sa s používateľmi hlasom a zvukom, čím sa táto menšia spoločnosť zaoberajúca sa umelou inteligenciou dostáva do priameho rozporu s technologickými gigantmi Google, Apple a Amazon v boji o vytvorenie inteligentnejších hlasových asistentov.

ChatGPT dokáže odpovedať na otázky používateľov hlasom jednej z piatich „osôb“, a v porovnaní s populárnymi hlasovými asistentmi, ako sú Alexa a Siri, reaguje tónom, ktorý znie hovorovejšie. Spoločnosť OpenAI uviedla, že pridanie hlasu kľúčovým spôsobom, ako prilákať viac ľudí, aby používali ChatGPT.

„To je naša výzva,“ povedal v rozhovore Peter Deng, viceprezident spoločnosti OpenAI pre spotrebiteľské produkty. „Jednou z najťažších úloh je vziať túto úžasnú technológiu a priviesť ju k jednoduchosti, ktorú hľadá ďalších 300 až 400 miliónov ľudí.“

Preteky v oblasti AI

Spoločnosť Amazon, ktorá je jedným z lídrov v oblasti hlasových asistentov s Alexou, v posledných mesiacoch zaostáva v uvádzaní nových nástrojov AI pre širokú verejnosť.

V pondelok, v ten istý deň ako OpenAI oznámila novinku o ChatGPT, oznámil Amazon, že podpísali dohodu o investovaní až štyroch miliárd dolárov do iného startupu s umelou inteligenciou, spoločnosti Anthropic.

Ide o najväčšiu dohodu v oblasti umelej inteligencie od začiatku roka, keď spoločnosť Microsoft podpísala svoju prelomovú investíciu do OpenAI, a odráža to, ako technologické giganty vsádzajú na horúce startupy v oblasti umelej inteligencie. Investícia Microsoftu do OpenAI, ktorá viedla k mnohým produktovým partnerstvám, mu pomohla raketovo napredovať v pretekoch v oblasti AI.

Vývoj nasleduje po niekoľkých spusteniach umelej inteligencie spoločnosťami, ako sú Google, Amazon a OpenAI, v minulom týždni. Konkurenčné preteky tak prebiehajú v šialenom tempe.

Spoločnosti zároveň skúšajú rôzne prístupy, ako presvedčiť ľudí, aby ich botov používali a platili za nich. Práve ich umiestnenie do existujúcich reproduktorov je jednou z kľúčových ciest, ktorými sa teraz zaoberajú.

Minulý týždeň Amazon oznámil, že do svojich reproduktorov Alexa, ktoré sú nainštalované v miliónoch domácností, pridáva funkciu „konverzácie“ s chatbotmi. V lete spoločnosť Google informovala svojich zamestnancov, že sa snaží umiestniť technológiu chatbota Barda do svojich vlastných hlasových asistentov.

Návrhy receptov

Doteraz mohli ľudia klásť ChatGPT otázky tak, že ich nahlas vyslovili v mobilnej aplikácii, ale bot odpovedal textom. Spoločnosť OpenAI tiež uviedla, že ľudia teraz môžu do bota nahrať obrázky ako súčasť svojich otázok, napríklad ukázať fotografiu prísad v chladničke a požiadať ChatGPT, aby prišiel s návrhmi receptov.

Pridanie hlasových a obrazových funkcií tiež posúva ChatGPT ďalej k tomu, aby sa stal skutočným „multimodálnym“ modelom - chatbotom, ktorý okrem textových podnetov dokáže „vidieť“ a „počuť“ svet a reagovať hlasom a obrazom.

Výskumníci a analytici v oblasti umelej inteligencie tvrdia, že multimodálne modely sú ďalšou etapou konkurencie v tomto odvetví a spoločnosti sa predháňajú, aby vytvorili čo najschopnejší model.

Hlasoví asistenti sú v autách, smartfónoch, televízoroch a domácich reproduktoroch už roky a denne ich používajú milióny ľudí. Ich používanie sa však väčšinou obmedzuje na malý súbor rutinných interakcií, ako je napríklad žiadosť o zhasnutie svetla alebo poskytnutie správy o počasí.

Technológia „veľkého jazykového modelu“, ktorá stojí za chatbotmi, otvára možnosť, že hlasoví asistenti by mohli byť oveľa schopnejší viesť dlhšie, prirodzené rozhovory a odpovedať na zložitejšie otázky.

Investori a analytici spoločnosť Amazon kritizujú za pomalú reakciu na konkurenciu v oblasti chatbotov a generátorov obrázkov, a dohoda s firmou Anthropic jej umožní prístup k výskumníkom a technológiám tohto startupu.

Spoločnosť Anthropic založili bývalí zamestnanci OpenAI a predtým do nej investoval Google. (Zakladateľ Amazonu Jeff Bezos vlastní denník Washington Post, ktorého dočasná generálna riaditeľka Patty Stonesifer je členkou predstavenstva Amazonu.)

Spoločnosť OpenAI odštartovala boom chatbotov v novembri, keď zverejnila ChatGPT. Odvtedy sa technologické giganty snažia vyvinúť vlastného chatbota, pričom Microsoft spolupracuje s OpenAI, aby využil jej technológiu, a Google uvádza na trh svojho chatbota s názvom Bard.

Rozprávky od ChatGPT

Výskumníci v oblasti umelej inteligencie varovali, že ľudia si chatboty pravdepodobne predstavujú v ľudskej podobe, najmä preto, lebo ich odpovede sa zvyčajne podobajú na ľudské. To by mohlo u používateľov vyvolať falošný pocit dôvery v inteligenciu alebo schopnosti bota.

Všetky chatboty si stále bežne vymýšľajú informácie a vydávajú ich za skutočné, čo je problém, ktorý výskumníci AI označujú ako „halucinácie“.

Nové persóny pre ChatGPT majú názvy Sky, Ember, Breeze, Juniper a Cove. Každá z týchto persón má iný tón a prízvuk. „Sky“ znie trochu ako Scarlett Johansson, herečka, ktorá nahovorila umelú inteligenciu, do ktorej sa zamiluje postava Joaquina Phoenixa vo filme „Her“ (na Slovensku „Ona“) z roku 2013. Deng, výkonný riaditeľ spoločnosti OpenAI, povedal, že hlasové persóny nemajú znieť ako nejaká konkrétna osoba.

V demonštračnej ukážke ukázal, ako bot dokáže porozumieť rozvláčnym a otvoreným hlasovým otázkam. Podľa jeho slov namiesto toho, aby ste museli premýšľať, ako presne formulovať otázku, nové funkcie uľahčujú konverzáciu a umožňujú jej voľnejší priebeh.

„Vďaka tejto funkcii môžete jednoducho hovoriť,“ povedal Deng. „Moje deti teraz žiadajú rozprávky pred spaním prostredníctvom ChatGPT.“

Spoločnosť OpenAI testovala hlasové a obrazové funkcie a pridala ochranné bariéry, aby sa zabezpečilo, že bot bude vhodne reagovať na citlivé témy, napríklad navrhne používateľovi konzultáciu s odborníkom, ak sa pýta na otázky týkajúce sa duševného zdravia, uviedla v rozhovore Sandhini Agarwal, výskumníčka politiky v spoločnosti OpenAI. Podľa nej však bude potrebné urobiť ešte viac. „Práca sa neskončí zajtra.“