Jak moc nám chatboti lžou? Velký test odhalil jejich slabiny, pohořel ChatGPT, Copilot i Gemini Hlavní stránka Zprávičky Velký test prověřil nejznámější chatboty V sumarizaci a zjednodušování dlouhých textů občas lžou úplně všichni V 51 % jejich odpovědí byla chyba, někdy i vážná Sdílejte: Jana Skálová Publikováno: 20.2.2025 12:00 3 komentáře 3 Chatboti jsou dobrými pomocníky a řada uživatelů na ně spoléhá nejen v soukromém životě, ale i v tom pracovním. Necháváme je psát za nás e-maily, chceme po nich rešerše a zestručnění textů, vyžadujeme zkrácení dlouhých textů a tak dále. To vše zvládnou během chvíle. Ale zvládnou to skutečně správně? Britská BBC se rozhodla prozkoušet jejich schopnosti právě v oblasti sumarizace, přičemž pak tým redaktorů detailně kontroloval správnost odpovědí chatbotů. Do testu se zapojila největší čtyřka: chatGPT, Copilot, Gemini a také Perplexity. A aby byly výsledky skutečně dobře prověřitelné, dostali chatboti za úkol vyhledávat a sumarizovat články vzniklé právě v BBC. Chybovost je někdy velká Možná už víte, že chatboti občas takzvaně halucinují. To znamená, že když neznají odpověď na vaši otázku, jednoduše vám nenapíšou „Promiň, tohle nevím“. Začnou si zkrátka vymýšlet. V oblasti sumarizace textů bychom ale očekávali, že jejich odpovědi budou zcela přesné a pravdivé. Vždyť na tom de facto není co zkazit. Analýza ale ukázala opak. Nějaká chyba byla zjištěna v 51 % jejich odpovědí. Tedy v mírně nadpoloviční většině. V 19 % byly dokonce odhaleny faktické chyby. A ve 13 % odpovědí si chatboti svévolně upravili citace, ale tvrdili, že pocházejí z daného zdroje. Co se týká jednotlivých jazykových modelů, tak Gemini udělala chyby ve 34 % případů, Copilot ve 27 %, Perplexity v 17 % a ChatGPT v 15 %. Nejlépe tak z testování vyšel chatGPT a hned za ním Perplexity. Oba tyto modely ale také chybují. Proto je potřeba používat je obezřetně a vždy přesně kontrolovat a prověřovat jejich odpovědi. Někdy jde totiž o drobné chybky, které nikomu nevadí – jindy jde ale o závažná pochybení, kvůli nimž může celý obsah z původního zdroje naopak vyznívat úplně jinak. Důvěřujete odpovědím chatbotů? Zdroj: BBC, Pixabay O autorovi Jana Skálová Jana se psaním živí už dlouhé roky. Začínala ve zpravodajství a lifestylu, teď se věnuje spíš techničtějším tématům. Ráda píše o mobilech, zajímá se o… Více o autorovi Sdílejte: 3 komentáře Vložit komentář AI chatbot ChatGPT Copilot Gemini výzkum Mohlo by vás zajímat Android Auto dostane schopnějšího asistenta! Takto (zhruba) vypadá Gemini v akci Adam Kurfürst 9.1. Google se chystá nasadit Gemini na chytré hodinky s Wear OS. Můžeme čekat češtinu? Libor Foltýnek 8.1. Google uhodil hřebíček na hlavičku. Novou funkci Gemini si uživatelé zamilovali a teď je navíc ještě lepší Adam Kurfürst 16.11.2024