Google rozšiřuje svou rodinu otevřených AI modelů o novou generaci Gemma 3, která přináší zásadní vylepšení v oblasti výkonu, flexibility a dostupnosti. Modely Gemma fungují nejen v cloudu, ale i na běžných zařízeních – od smartphonů přes laptopy až po workstation. Dostupné jsou ve čtyřech variantách podle velikosti: 1 miliarda, 4 miliardy, 12 miliard a 27 miliard parametrů.
Špičkový výkon na jednom zařízení
O Gemmě 3 se teď mluví jako o „nejlepším modelu pro jeden akcelerátor“. Tj. i největší 27B varianta zvládne běžet na jednom GPU (čipu, který je tzv. srdcem grafické karty zařízení) nebo TPU (Google mikroprocesoru). A bez nutnosti masivních serverových clusterů. To slibuje její nasazení i na relativně běžném hardwaru, včetně mobilních zařízení s výkonnými čipy, jako je Google Pixel s Tensor Processing Core 6.
Otevřenost a snadné nasazení
Velkou výhodou Gemma 3 oproti uzavřeným modelům (například Gemini) je otevřený přístup. Vývojáři si mohou model stáhnout, upravit a použít podle svých potřeb – ať už přímo v aplikacích, nebo při vývoji vlastních služeb. Model je dostupný přes Google AI Studio, ale také na platformách jako Hugging Face, Ollama nebo Kaggle.
Multimodalita a jazyková univerzálnost
Gemma 3 zvládá nejen textové úlohy, ale i práci s obrázky a krátkými videi (tzv. multimodalitu). Vytváří tak aplikace, které analyzují a kombinují různé typy vstupů. Model podporuje více než 140 jazyků, z toho 35 je předtrénovaných. Zkrátka skvělý adept na globální nasazení.
Rozšířený kontext a funkce pro agentní AI
Jedním z hlavních technických vylepšení je rozšířený kontext. Gemma 3 zvládne zpracovat až 128 000 tokenů najednou, což odpovídá zhruba 200 stránkám textu. Díky tomu je model vhodný pro práci s dlouhými dokumenty, analýzu rozsáhlých dat nebo vedení komplexních konverzací. Podporuje také tzv. function calling (AI model může přímo oslovit externí funkce nebo API. Získá tak jen na základě jednoho dotazu uživatele více souvisejících informací kupř. o aktuálním počasí, rezervuje letenku. Pilně pracuje s daty v databázi, podporuje jejich strukturované výstupy.
Efektivita a rychlost
Díky kvantizovaným verzím jsou modely Gemma 3 velmi úsporné na výpočetní výkon a paměť, což umožňuje jejich běh i na zařízeních s omezenými zdroji (například notebooky s běžnou grafickou kartou). To je zásadní pro nasazení v mobilních aplikacích a všude tam, kde je potřeba nízká latence a rychlá odezva.
Srovnání s konkurencí
Gemma 3 ve výkonnostních testech překonává jiné otevřené modely jako DeepSeek V3, OpenAI o3-mini nebo Llama3-405B. Největší varianta (27B) se podle některých benchmarků dokonce blíží výkonu uzavřeného modelu Gemini 1.5 Pro, přičemž ji lze provozovat na jednom GPU.
Kde Gemma 3 využít?
Tento AI model vám pomůže s generováním textu, sumarizacemi, překlady. Také s analýzou obrázků. Ale i tvorbou agentních aplikací, které automatizují složité workflow. Open source a možnost běhu na běžném hardwaru z něj dělají ideální volbu pro vývojáře, startupy. Využít ho však mohou i firmy, které chtějí mít svá AI řešeními pod kontrolou. Pokud tento AI model zaujal i Vás, můžeme se na něj spolu podívat blíže. Stačí se mi ozvat a sjednat si konzultaci na jsem@mistr.ai. Rád Vás provedu světem AI modelů směrem k Vašemu cíli:).
Zdroj: digitaltrends.com, Google