Umělá inteligence porozuměla emocím, dokáže mluvit hlasem a tónem napodobujícím člověka
- Články
- Jana Skálová
- 3.12.2024
- 2
- Newyorský startup Hume AI naučil umělou inteligenci chápat emoce
- Ve spolupráci s Claude AI ukázal, že AI dokáže mluvit lidským tónem
- Předčí tím modely jako chatGPT nebo Gemini
Hodně se diskutuje o tom, co se stane, až se umělá inteligence naučí chápat lidské emoce. A až se naučí používat je. Mnozí to považují za sci-fi, ale americký startup Hume AI ukázal, že chatboti hovořící s lidmi emocionálně podbarveným hlasem nejsou dalekou budoucností. Je to možné už dnes.
Pokud jste si někdy zkoušeli povídat s Gemini od Googlu, s chatGPT nebo různými hlasovými asistenty, pak vám odpovědi přicházely monotónně a jednotvárným tónem. Tak to ostatně od “robotů” očekáváme. Jenže už brzy se to může změnit. Vývojáři Claude AI ze společnosti Anthropic se pustili do zajímavého experimentu s kolegy z výzkumné laboratoře Hume AI. Ti se snaží naučit umělou inteligenci nejen chápat emoce, ale používat je také v konverzaci.
Výsledkem jejich spolupráce je rozhraní s názvem Empathic Voice Interface 2 (EVI 2), které dokáže analyzovat tónu, rytmus a barvu řeči uživatele. Vývojáři navíc chatbotovi dávali různé příkazy ohledně toho, co jaké operace má provádět na počítači. Nejen, že správně vyhodnotil emocionální rozpoložení uživatele a dokázal mu odpovídat ve stejném tónu, ale plně dokázal nahradit myš i klávesnici nebo dělat třeba printscreeny.
Budoucnost ovládání počítačů
Z toho plynou hned 2 zajímavé závěry. Zaprvé ten, že už brzy možná u počítače nebudeme potřebovat klávesnici ani myš, protože ho budeme moci ovládat hlasem. A zadruhé je tu umělá inteligence s emoční inteligencí, která dokáže hovořit hlasem podbarveným emocemi. A zvládá to překvapivě dobře.
Ve startupu Hume AI své hlasové rozhraní použili pro 2 miliony minut hlasových konverzací s umělou inteligencí Claude AI. Různé podněty se přitom ukládají do mezipaměti Anthropicu, díky čemuž je chatbot nejen rychlejší v odpovídání, ale je i přesnější. Dokáže odposlouchat i drobné nuance ve změně tónu hlasu a vyhodnotit tak aktuální lidské emoce.
Tato spolupráce podle mluvčího Hume AI snížila náklady o 80 % a učinila tak výjimečný produkt Hume AI dostupnějším širší škále uživatelů. Cílem Anthropicu a Hume AI je přitom vytvořit nový standard, který zajistí, aby umělá inteligence lépe a přesněji reagovala na emoce uživatelů a dokázala se jim přizpůsobit.
Ceník emoční umělé inteligence
Chtěli byste si to vyzkoušet? Hume AI je placená, nicméně se platí pouze za čas, který využíváte. Cena je aktuálně stanovena na:
- 0,102 dolarů za minutu u rozhraní EVI 1
- 0,072 dolarů za minutu u rozhraní EVI 2
Druhé jmenované přitom nabízí nižší latenci, výběr ze 7 hlasů (oproti základním 3 hlasům) a v budoucnu i podporu více jazyků (aktuálně je možné konverzovat pouze anglicky).
Pakliže chcete pouze o textovou konverzaci, bude vás to stát 0,00008 dolarů za každé slovo. Generování obrázků vychází na 0,00068 dolarů za kus, u videí je cena stanovena na 0,015 dolarů za minutu. Video s audiem vás vyjde na 0,0276 dolarů za minutu.
Co si myslíte o schopnosti AI analyzovat emoce?
Jana se psaním živí už dlouhé roky. Začínala ve zpravodajství a lifestylu, teď se věnuje spíš techničtějším tématům. Ráda píše o mobilech, zajímá se o… více o autorovi
Komentáře (2)
Přidat komentář