TOPlist

Zručnost, interaktivita, všeobecnost. Google představuje umělou inteligenci pro roboty „Gemini Robotics“

  • Umělé inteligence pro roboty jsou novým počinem Google DeepMind, překvapují svou nadčasovostí
  • Jmenují se Gemini Robotics a Gemini Robotics-ER
  • AI byla vyzkoušena na robotických pažích ALOHA 2, ale lze ji specializovat i na humanoidní roboty

Sdílejte:
Pavlína Čížková
Pavlína Čížková
14.3.2025 14:00 (9.4.2025 18:54)
Ikona komentáře 0
Gemini Robotics e1741816586800

Google DeepMind se pochlubil dvěma novými modely umělé inteligence založené na Gemini 2.0, zatím nejschopnější AI této společnosti. Tentokrát ale nenechává své výtvory za hranicemi virtuálního světa, a to díky umu „ztělesněného uvažování“, kterým nové modely disponují.

Umělá inteligence podle Googlu dokáže vykonat všechny potřebné kroky k tomu, aby dokázala kontrolovat robota prakticky hned po vybalení z krabice. Z čeho všeho se ale tyto kroky skládají?

Můžeme si představit například schopnosti obecného vnímání, odhadování situací, prostorového chápání nebo dokonce plánování.

Gemini Robotics-ER rozpoznává objekty

První model se nazývá Gemini Robotics; pokročilý VLA model postavený na Gemini 2.0. Jeho účel tkví čistě v kontrolování robotů.

Naopak druhý model jménem Gemini Robotics-ER disponuje rozvinutým prostorovým vnímáním, což vývojářům robotů umožní spouštět své vlastní programy pomocí výše zmíněné schopnosti ztělesněného uvažování AI.

V čem umělé inteligence Gemini Robotics ale opravdu excelují?

Oba dva modely toho mají spoustu společného, a jmenovitě pak tři důležité vlastnosti: zručnost, interaktivitu a všeobecnost.

Všeobecnost dovoluje Gemini Robotics vyznat se v nebývalých situacích a řešit širokou škálu zadání, dokonce i těch, které ještě předtím nikdy během trénování neviděla.

Google DeepMind uvádí, že oproti současným technologiím jejich AI dokonce zdvojnásobuje výkon ve zobecňování komplexních situací. Dělají z robotů tedy renesanční nástroje s jednoduchou a funkční odpovědí na vše složité.

Schopnost dynamicky interagovat usnadňuje robotům se úspěšně a především bezpečně navigovat v našem fyzickém světě. Pro roboty by tedy neměl být problém interagovat i přímo s lidmi, nebo reagovat na své okolí a svižně se mu přizpůsobovat.

Interaktivita Gemini Robotics je přitom velmi intuitivní, a to díky základům položeným na Gemini 2.0, která by bez možnosti interakce nemohla fungovat.

Třetí pýchou a zároveň velmi zásadním stavebním kamenem umělé inteligence je zručnost. Pro lidské bytosti jsou každodenní úkony, které zručnost vyžadují, v podstatě automatické a bez námahy. To samé se samozřejmě nedá říci o robotech.

Gemini Robotics i zde ale vyčnívá z řad stereotypů; AI zvládá plnit i extrémně složitá zadání, která vyžadují komplexní manipulaci s předměty, jako například skládat origami nebo zabalit svačinu do zapínacího sáčku.

V tuto chvíli byla umělá inteligence Gemini Robotics vyzkoušena například na robotických pažích ALOHA 2, ale lze ji specializovat třeba i na humanoidní roboty Apollo vyvinuté společností Apptronik.

Výhled na Googlem poháněné roboty plnící každodenní činnosti tedy není nerealistický, právě naopak – Google DeepMind si to pokládá za svůj cíl.

Jaká máte očekávání od vývoje Gemini Robotics?

Zdroj: Google DeepMind

O autorovi

Pavlína Čížková

Pája nemálo kdy slýchá, že vypadá, jako by do přítomnosti přišla z cyberpunkového budoucna. Nejen svou prezentací, ale i svými zájmy dává veřejnosti každý den… Více o autorovi

Pavlína Čížková
Sdílejte: