Jak Google Gemini rozpozná AI obrázky
Google začal koncem listopadu 2024 postupně zavádět do aplikace Gemini schopnost ověřovat, zda byl nahraný obrázek vytvořen nebo upravován nástrojem umělé inteligence. Proces je extrémně jednoduchý – nahrajete fotografii a položíte otázku typu „Je toto vygenerované AI?” Systém pak snímek analyzuje a poskytne odpověď. Pro správné fungování je důležité přepnout z režimu „Fast” na „Myšlení s modelem 3 Pro”, jinak Gemini obrázky řádně neprozkoumá.
Tato novinka zatím funguje pouze u obrázků, ale Google slibuje, že brzy přidá možnost ověřovat i videa a zvukové nahrávky. V budoucnu se funkce rozšíří i do dalších produktů Googlu, včetně vyhledávání Google Search.

Technologie SynthID stojí v pozadí detekce
Základem celého systému je technologie SynthID, kterou Google vyvíjí od srpna 2023. Jde o digitální vodoznak, který se při generování obrázku automaticky vloží přímo do struktury pixelů. Pro lidské oko zůstává neviditelný, ale Gemini ho dokáže spolehlivě identifikovat.
SynthID využívá dva propojené modely hlubokého učení – jeden pro vložení vodoznaku a druhý pro jeho rozpoznávání. Od svého spuštění označila technologie už přes 20 miliard děl vytvořených umělou inteligencí. Vodoznak přitom přežije běžné úpravy jako přidání filtrů, změnu barev nebo uložení v komprimovaném JPEG formátu.
Systém poskytuje tři úrovně spolehlivosti při identifikaci vodoznaku. Pokud SynthID detekuje svůj vodoznak, znamená to, že alespoň část obrázku byla vytvořena nástrojem Imagen od Googlu.
Gemini odhalí i obrázky z jiných AI generátorů
Google ale nespoléhá jen na vlastní vodoznaky. Gemini dokáže analyzovat samotný obsah snímku a hledat typické znaky charakteristické pro AI tvorbu. I když obrázek pochází z nástroje jako ChatGPT nebo Midjourney, Gemini často pozná, že se jedná o dílo umělé inteligence.
Testy publikované na serveru Chip.cz ukázaly, že Gemini správně rozpoznal AI obrázky nejen z vlastní produkce, ale i z konkurenčních generátorů. U snímků, které nebyly vytvořeny Googlem, dokázal systém odhadnout, že pravděpodobně pochází z jiného AI generátoru.
Na co se Gemini u obrázků zaměřuje
Když Gemini analyzuje obrázek bez vodoznaku SynthID, zkoumá řadu specifických charakteristik, které prozrazují AI původ. Jedná se o sofistikovanou kombinaci detekce vizuálních anomálií a nepřirozených prvků.
Deformace v detailech: Klasickým problémem AI generátorů jsou ruce s podivným počtem prstů nebo zuby vypadající nepřirozeně. Podobné chyby se objevují u šperků, brýlí nebo drobných předmětů. I když se moderní AI nástroje v tomto ohledu zlepšují, Gemini si těchto anomálií stále všímá.
Světlo a textura: Umělá inteligence občas špatně zvládne rozložení světel a stínů. Světlo může dopadat z několika směrů najednou nebo naopak chybí stíny tam, kde by měly být. Textura materiálů může působit uměle – dřevo, kámen nebo látky vypadají příliš dokonale nebo nejasně.
Nesmyslný text: Když AI generuje obrázek s textem, třeba ceduli, nápis na obalu nebo plakát, často vznikne nečitelná směs písmen. Gemini si všímá, když text nedává smysl nebo připomíná náhodné znaky.
Celková atmosféra: Některé AI obrázky prostě působí divně. Může jít o příliš hladkou kůži bez pórů, nepřirozeně dokonalou kompozici nebo chaotické uspořádání prvků, které spolu nesouvisí. Gemini dokáže tyto jemné znaky vyhodnotit.
Přirozené nedokonalosti: AI sleduje, zda jsou na obrázku znázorněny přirozené detaily jako skvrny na betonu, nerovnosti na chodníku nebo specifické odlesky na zaparkovaných autech. Jejich absence nebo naopak příliš dokonalé provedení může být varovným signálem.
Geografické a architektonické nesmysly: Umělá inteligence občas vytvoří budovy nebo scenérie, které z hlediska architektury nedávají smysl. Okna mohou být v divných pozicích, dveře vedou nikam nebo perspektiva stavby jednoduše nesedí.
Průmyslové standardy a transparentnost obsahu
Google nejde cestou izolovaných řešení, ale aktivně se zapojuje do širší iniciativy za transparentnost digitálního obsahu. Od prosince 2024 začaly obrázky vytvořené pomocí Nano Banana Pro (Gemini 3 Pro Image) obsahovat také C2PA metadata – průmyslový standard, který zaznamenává informace o původu obsahu.
Společnost je součástí řídícího výboru Coalition for Content Provenance and Authenticity (C2PA), organizace spojující technologické firmy v úsilí o větší transparentnost. Google plánuje postupně rozšířit podporu detekce i na obrázky vytvořené nástroji jiných společností, pokud budou používat C2PA standard.
V Google Search už začíná funkce „About this image” zobrazovat informace, pokud obrázek obsahuje C2PA metadata. Uživatelé tak mohou vidět, zda byl snímek vytvořen nebo upraven pomocí AI nástrojů. Podobná integrace probíhá i v reklamních systémech Googlu.
Kam směřuje budoucnost detekce AI obsahu
Zatímco ruční ověřování obsahu v Gemini představuje užitečný krok vpřed, skutečný potenciál C2PA a vodoznaků typu SynthID se naplno projeví až ve chvíli, kdy sociální sítě začnou automaticky označovat AI vytvořený obsah. Namísto toho, aby uživatelé museli sami ověřovat každý obrázek, platformy by mohly preventivně informovat o původu materiálu.
Podle interních testů Googlu dokázala AI Gemini správně identifikovat jak AI obrázky, tak skutečné fotografie. I když technologie není dokonalá, interní testy ukazují přesnost proti mnoha běžným úpravám obrázků.
Do budoucna Google slibuje rozšíření ověřování SynthID i na videa a zvukové nahrávky. Postupně se objeví i v dalších produktech jako Google Search. Cílem je vytvořit ekosystém, kde uživatelé mohou ověřovat původ obsahu bez ohledu na to, jaký nástroj byl použit.
Zdroje: CHIP.cz | The Verge | Google DeepMind Blog | Google Blog | Svět Androida | Google Support