Google Bard přidává Gemini! Zatím nejschopnější model umělé inteligence
- Zprávičky
- Zuzana Přibylová
- 7.12.2023
- 0
- Google představil multimodální model Gemini
- Dokáže zpracovávat různé typy souborů
- Už nyní je dostupný v rámci Barda a pro Pixel
Google představuje svojí multimodální umělou inteligenci, která je označována za jednu z těch nejflexibilnějších a nejsofistikovanějších modelů. Gemini dokáže zobecnit informace, bezproblémově porozumět zadání a na rozdíl od konkurenčních systémů dokáže kombinovat různé typy informací. To znamená, že je schopen rozumět textu, fotkám, zvukům, videím a dokonce i kódovacímu jazyku. Nabídne 3 různé verze, a jedna z nich je už nyní dostupná pro širokou veřejnost v rámci předchozí generace AI Bard a také pro telefony Pixel.
Gemini je výsledkem spolupráce mezi Googlem, DeepMind a Google Research a jedná se o zatím o dosud největší vědecký a inženýrský projekt. Nová AI má za cíl změnit způsoby, jakým podnikatelé i spotřebitelé fungují s podobnými modely a chtějí nabídnout komplexního pomocníka do každého dne. A kromě toho umožňuje integraci a propojení od mobilních zařízení až po velká datová centra, která zpracovávají obrovské množství dat.
Testing Gemini Pro on Bard this morning. The export to @Replit is smooth and fast.
Here's an example of creating a Python script to automate data manipulation of a csv.
Write the steps in natural language. Export to @Replit. Click run.
This is a simple example, but you can… pic.twitter.com/bNBzyT3v3r
— Jeff Burke ⠕ (@Jeff_Burke14) December 6, 2023
Tři verze, avšak dočkáme se jich postupně
Gemini 1.0 bude dostupný ve třech základních verzích, avšak uvolňovány budou postupně. V první fázi byl v Bardu spuštěn Gemini Pro, který je sice v pokročilé fázi uvažování, ale zatím dokáže rozumět a zpracovávat zadání jen v angličtině. Gemini Nano verze je k dispozici pro zařízení Android. V následující fázi začátkem příštího roku dorazí nový Bard Advanced, který bude mít přístup k modelu Gemini Ultra. Toto postupné zveřejňování je díky probíhajícímu testování. Google chce zajistit, aby byl model bezpečný, dokázal si pamatovat, ověřovat informace a zvládnul se učit z vlastních chyb.
Gemini rozumí a kombinuje různé typy informací
Gemini je tzv. nativně multimodální model, což znamená, že bude schopen zpracovávat a integrovat více vstupů či dat. Na rozdíl od jiných modelů dokáže identifikovat i videa či zvuky na jednom místě, což by mohlo zefektivnit zpracování a interpretaci datových souborů. Porozumí textu, dokáže racionálně uvažovat a kódovat. Dle benchmark testů textu v šesti z osmi případů dokonce verze Ultra překonala GPT-4.
Google nezapomněl ani na vývojáře
Gemini splní potřeby jak spotřebitelům, tak vývojářům. Vývojáři budou moci využívat Gemini Pro prostřednictvím API v Google AI Studio a Vertex AI. Google AI studio je bezplatný nástroj pro vývoj aplikací, zatímco Vertex AI zase nabídne pokročilejší správu s důrazem na bezpečnost a správu dat. Pro uživatele Androidu, vývojáře bude k dispozici Gemini Nano prostřednictvím AICore v Androidu 14(od Pixel 8 Pro).
Interaktivní test modelu na papírové raketce
Google je známý tím, že své produkty prezentuje na zajímavých interaktivních videích. Tentokrát ve spojení s Youtuberem Markem Roberem, pomocí Barda v kombinaci s Gemini Pro verzí, speciálně vyladili papírovou vlaštovku/letadlo. Bard dokázal vygenerovat model letadla se kterým následně provedl řadu letových testů. Následně navrhl razantní zvětšení modelu a poskytnul rady, jak techniku vylepšit. Na závěr Bard dokázal přesně napsat, proč určité lety nebyly úspěšné – tím ušetřil nejen čas, ale poskytl praktické tipy, které by zabraly několik týdnů výzkumu.
AI makes a Mark Rober video | Bard with Gemini Pro
Myslíte, že má šanci konkurovat ChatGPT?
Zdroj: Blog.Google, 9to5Google
Od dětství ji fascinovaly nejnovější technologie, počítače a veškeré druhy herních konzolí. S PlayStationem 1 a později Xboxem 360 začala její vášeň pro herní svět,… více o autorovi
Komentáře (0)
Přidat komentář