Gemini umí generovat obrázky! Vyzkoušeli jsme, jak jí to (ne)jde

Gemini se naučila generovat obrázky
Zkoušet to může kdokoliv a zcela zdarma
Novou funkci jsem důkladně prověřila za vás

Sdílejte:

Jana Skálová

Publikováno: 31.1.2025 12:00

4 komentáře

V minulých dnech se možná i na vašem mobilu objevilo oznámení, že umělá inteligence Gemini od Googlu má novou funkci – umí generovat obrázky. Stačí napsat nebo vyslovit příkaz začínající slovy jako „vygeneruj“ nebo „vytvoř“ a pak už jen popíšete, o jaký obrázek máte zájem. Čím více detailů přidáte, tím lépe. Následně už se jen můžete těšit na výsledek.

Ale stojí to skutečně za to a může Gemini konkurovat takovým generátorům jako je Midjourney nebo třeba Leonardo.ai? Vyzkoušela jsem, jaké jsou její schopnosti a jak dobře dokáže porozumět promptům. A výsledek vás nejspíš překvapí.

Imagen 3 v Gemini
Nedostatky v Gemini
Výsledky mile překvapí

Imagen 3 v Gemini

Gemini dosud uměla vyhledávat obrázky a zobrazovat je přímo v chatu. Teď Google její funkce vylepšil tím, že do ní vložil svůj AI generátor obrázků Imagen 3. O tom jsme vás informovali už v srpnu loňského roku, kdy ho Google představil a spustil v USA. Teď funguje přímo v Gemini, ale má jisté nedostatky.

Pozitivem je, že je zcela bez limitů a můžete generovat třeba jeden obrázek za druhým. Prompty lze zadávat v češtině, ale klidně i v angličtině. A to vše zcela zdarma a bez nutnosti hlídat si kredity, tokeny nebo cokoliv jiného.

Nevýhodou je, že Gemini neumí generovat lidi. Alespoň ne ve svých základních modelech. Pokud jí tedy dáte za úkol vytvořit obrázek ženy, dítěte či muže (nebo jakékoliv postavy obecně), po chvíli snažení vám zobrazí zprávu, že generování obrázků lidí je zatím přístupné pouze předběžném přístupu v Gemini Advanced. Tato verze už je ale placená. Takže volba je na vás.

Prompt: An Impressionist wall art of a sunlit olive grove, golden sunlight filtering through twisted olive trees, leaves shimmering in shades of sage, emerald, and olive green. The ground is bathed in warm browns and soft oranges, dappled light dancing across the scene. Painted with short, airy brushstrokes, soft blurring, and an ethereal glow, capturing a tranquil

Nedostatky v Gemini

A jak to Gemini jde? Stejně jako u ostatních generátorů obrázků (nebo u chatbotů obecně) platí, že čím vyšší je kvalita promptu, tím vyšší je kvalita výstupu. Občas ale Imagen 3 dělá nepříjemné chyby. Když jsem třeba chtěla obrázek chameleona s motorkou v pozadí, tak na motorku posadil jezdce, ale nějak mu zapomněl přidat nohy.

Nicméně, i velmi pokročilá Midjourney ještě nedávno nezvládala správně generovat ruce a nohy a tyto partie zkrátka AI generátorům dělají problémy. Na obranu Gemini ale musím říct, že pokud budete chtít lidi jen jako doplněk obrázku (nebudete se tedy snažit o portrét), Gemini to v klidu zvládne.

Také byste po ní neměli chtít přesné texty. Ty jí zkrátka nejdou a písmena si kombinuje zcela nahodile. Když jsem požadovala vygenerování balonku s nápisem SMILE, vznikl z toho nápis HUPD LIST. Těžko soudit, kde se vzal.

Výsledky mile překvapí

Celkově ale hodnotím výsledky jako velmi dobré. Pokud si vygenerovaný obrázek otevřete, můžete si ho následně stáhnout i do svého zařízení. Jeho velikost nebude nijak extrémní – ukládá se ve formátu JPEG a velikost je okolo 500 kB. Plakát na stěnu si z něj sice neuděláte, ale pro posílání, zveřejňování na sociálních sítích a tak dále je to plně dostačující.

Na výsledky mého snažení se můžete podívat výše v galerii. A sami posuďte, jak to Gemini zvládá. Přitom je pravděpodobné, že v budoucnu dostane různá vylepšení a půjde jí to lépe. Za mě je to až na drobné nedokonalosti docela dobrá práce.

Už jste vyzkoušeli generování obrázků v Gemini?

Zdroj: vlastní

O autorovi

Jana Skálová

Jana se psaním živí už dlouhé roky. Začínala ve zpravodajství a lifestylu, teď se věnuje spíš techničtějším tématům. Ráda píše o mobilech, zajímá se o… Více o autorovi

Sdílejte: