TOPlist

Google představil Gemini 2.5 Flash! Výrazně překonává předchůdce a zamíří i do aplikace

  • Gemini 2.5 Flash nabízí významné vylepšení výkonu díky schopnosti přemýšlení
  • Vývojáři mohou nastavit kolik „myšlenkových tokenů“ model spotřebuje při řešení
  • Model disponuje 1milionovým kontextovým oknem a podporuje multimodální vstupy

Sdílejte:
Adam Kurfürst
Adam Kurfürst
19.4.2025 10:00
Ikona komentáře 0
premyslejici umela inteligence se sviticim logem googlu a logem gemini ilustrace k gemini 2.5 flash

Google oficiálně uvedl už dříve avizovaný model Gemini 2.5 Flash, který je nyní dostupný v režimu preview prostřednictvím Gemini API v Google AI Studio a Vertex AI. Novinka staví na populárním základu verze 2.0 Flash, ale přináší výrazné vylepšení schopností uvažování při zachování rychlosti a ekonomické efektivity, na které jsou uživatelé zvyklí.

První model s hybridním uvažováním

Gemini 2.5 Flash představuje první plně hybridní model s funkcí uvažování, což vývojářům umožňuje tuto schopnost podle potřeby zapínat a vypínat. Místo okamžitého generování odpovědi může model nejprve projít procesem „přemýšlení“, díky kterému lépe pochopí zadání, rozdělí složité úkoly na menší části a naplánuje odpověď. Na komplexních úkolech vyžadujících několik kroků uvažování (například řešení matematických problémů nebo analýza výzkumných otázek) tento proces umožňuje modelu dospět k přesnějším a komplexnějším odpovědím.

Nastavitelný „rozpočet myšlení“

Google si je vědom, že různé případy použití mají různé kompromisy v kvalitě, ceně a latenci. Proto vývojářům nabízí možnost nastavit „rozpočet myšlení“ (thinking budget), který poskytuje kontrolu nad maximálním počtem tokenů, které model může při přemýšlení vygenerovat. Vyšší rozpočet umožňuje modelu důkladnější uvažování a zlepšení kvality výstupu. Důležité však je, že rozpočet stanovuje pouze horní hranici – model nevyužívá celý rozpočet, pokud to zadání nevyžaduje.

gemini 2.5 flash baner

Pro ty, kteří chtějí udržet nejnižší cenu a latenci a přitom stále zlepšit výkon oproti 2.0 Flash, Google doporučuje nastavit rozpočet myšlení na 0. Alternativně můžete zvolit specifický tokenový rozpočet pro fázi myšlení pomocí parametru v API nebo posuvníku v Google AI Studio a Vertex AI. Rozpočet může u 2.5 Flash dosahovat až 24 576 tokenů.

Výjimečný poměr ceny a výkonu

Nový model nabízí podle Googlu nejlepší poměr ceny a výkonu na trhu. Dokonce i při srovnání s konkurencí poskytuje Gemini 2.5 Flash podobné metriky výkonu za zlomek nákladů. Na některých benchmarcích, jako je LMArena, si vede velmi dobře a umisťuje se hned za výkonnějším 2.5 Pro.

V porovnání s modelem 2.0 Flash přináší 2.5 Flash významné zlepšení v oblasti uvažování. Na testech jako AIME 2024 (matematika) dosahuje skóre 88 % oproti pouhým 32 % u předchozí verze. Model si také lépe vede v generování kódu, vizuálním uvažování a práci s dlouhým kontextem.

google gemini 2.5 flash cena a srovnani s konkurenci

Dostupnost v mobilní aplikaci Gemini

Kromě vývojářských rozhraní přichází Gemini 2.5 Flash také přímo do mobilní aplikace Gemini, kde nahradí dosavadní experimentální model 2.0 Flash Thinking, který byl naposledy aktualizován v březnu. Zatímco vývojáři mohou přesně nastavovat rozpočet myšlení, běžní uživatelé aplikace takovou kontrolu nedostanou – model bude automaticky upravovat míru uvažování podle složitosti dotazu.

Dobrá zpráva je, že v aplikaci Gemini budou s novým modelem dostupné všechny stávající funkce včetně aplikací (Apps, dříve Extensions), nahrávání souborů a dalších možností. Jde o další krok Googlu v přibližování pokročilých AI funkcí běžným uživatelům.

Dostupnost a budoucí vylepšení

Gemini 2.5 Flash s funkcemi přemýšlení je nyní k dispozici v preview verzi prostřednictvím Gemini API v Google AI Studio a Vertex AI, a také v dedikovaném rozbalovacím menu v aplikaci Gemini. Google povzbuzuje vývojáře, aby experimentovali s parametrem thinking_budget a prozkoumali, jak jim kontrolovatelné uvažování může pomoci řešit složitější problémy.

Google zároveň slibuje, že bude model Gemini 2.5 Flash nadále vylepšovat, přičemž brzy přijdou další novinky předtím, než bude plně dostupný pro produkční nasazení.

Jak model Gemini 2.5 Flash zaujal vás?

Zdroje: Google DeepMind, Google Developers, Google Blog, 9to5Google

O autorovi

Adam Kurfürst

Adam studuje na gymnáziu a technologické žurnalistice se věnuje od svých 14 let. Pakliže pomineme jeho vášeň pro chytré telefony, tablety a příslušenství, rád se… Více o autorovi

Adam Kurfürst
Sdílejte: