Google Gemini nyní pozná, jestli je fotka z AI generátoru

Sdílet
Google přináší do aplikace Gemini jednoduchou funkci pro rozpoznávání obrázků vytvořených umělou inteligencí. Stačí nahrát fotografii a zeptat se: „Byl tento obrázek vytvořen pomocí AI?" Systém využívá technologii neviditelného vodoznaku SynthID, která od roku 2023 označila přes 20 miliard AI děl. Gemini ale dokáže odhalit i snímky z konkurenčních generátorů tím, že analyzuje typické chyby a nepřirozenosti v obrázcích.
Google Gemini nyní pozná jestli je fotka z AI generátoru

Jak Google Gemini rozpozná AI obrázky

Google začal koncem listopadu 2024 postupně zavádět do aplikace Gemini schopnost ověřovat, zda byl nahraný obrázek vytvořen nebo upravován nástrojem umělé inteligence. Proces je extrémně jednoduchý – nahrajete fotografii a položíte otázku typu „Je toto vygenerované AI?” Systém pak snímek analyzuje a poskytne odpověď. Pro správné fungování je důležité přepnout z režimu „Fast” na „Myšlení s modelem 3 Pro”, jinak Gemini obrázky řádně neprozkoumá.

Tato novinka zatím funguje pouze u obrázků, ale Google slibuje, že brzy přidá možnost ověřovat i videa a zvukové nahrávky. V budoucnu se funkce rozšíří i do dalších produktů Googlu, včetně vyhledávání Google Search.

Ukazka funkce rozpoznani AI obrazku od Gemini
Google Gemini nyní pozná, jestli je fotka z AI generátoru 2

Technologie SynthID stojí v pozadí detekce

Základem celého systému je technologie SynthID, kterou Google vyvíjí od srpna 2023. Jde o digitální vodoznak, který se při generování obrázku automaticky vloží přímo do struktury pixelů. Pro lidské oko zůstává neviditelný, ale Gemini ho dokáže spolehlivě identifikovat.

SynthID využívá dva propojené modely hlubokého učení – jeden pro vložení vodoznaku a druhý pro jeho rozpoznávání. Od svého spuštění označila technologie už přes 20 miliard děl vytvořených umělou inteligencí. Vodoznak přitom přežije běžné úpravy jako přidání filtrů, změnu barev nebo uložení v komprimovaném JPEG formátu.

Systém poskytuje tři úrovně spolehlivosti při identifikaci vodoznaku. Pokud SynthID detekuje svůj vodoznak, znamená to, že alespoň část obrázku byla vytvořena nástrojem Imagen od Googlu.

Gemini odhalí i obrázky z jiných AI generátorů

Google ale nespoléhá jen na vlastní vodoznaky. Gemini dokáže analyzovat samotný obsah snímku a hledat typické znaky charakteristické pro AI tvorbu. I když obrázek pochází z nástroje jako ChatGPT nebo Midjourney, Gemini často pozná, že se jedná o dílo umělé inteligence.

Testy publikované na serveru Chip.cz ukázaly, že Gemini správně rozpoznal AI obrázky nejen z vlastní produkce, ale i z konkurenčních generátorů. U snímků, které nebyly vytvořeny Googlem, dokázal systém odhadnout, že pravděpodobně pochází z jiného AI generátoru.

Na co se Gemini u obrázků zaměřuje

Když Gemini analyzuje obrázek bez vodoznaku SynthID, zkoumá řadu specifických charakteristik, které prozrazují AI původ. Jedná se o sofistikovanou kombinaci detekce vizuálních anomálií a nepřirozených prvků.

Deformace v detailech: Klasickým problémem AI generátorů jsou ruce s podivným počtem prstů nebo zuby vypadající nepřirozeně. Podobné chyby se objevují u šperků, brýlí nebo drobných předmětů. I když se moderní AI nástroje v tomto ohledu zlepšují, Gemini si těchto anomálií stále všímá.

Světlo a textura: Umělá inteligence občas špatně zvládne rozložení světel a stínů. Světlo může dopadat z několika směrů najednou nebo naopak chybí stíny tam, kde by měly být. Textura materiálů může působit uměle – dřevo, kámen nebo látky vypadají příliš dokonale nebo nejasně.

Nesmyslný text: Když AI generuje obrázek s textem, třeba ceduli, nápis na obalu nebo plakát, často vznikne nečitelná směs písmen. Gemini si všímá, když text nedává smysl nebo připomíná náhodné znaky.

Celková atmosféra: Některé AI obrázky prostě působí divně. Může jít o příliš hladkou kůži bez pórů, nepřirozeně dokonalou kompozici nebo chaotické uspořádání prvků, které spolu nesouvisí. Gemini dokáže tyto jemné znaky vyhodnotit.

Přirozené nedokonalosti: AI sleduje, zda jsou na obrázku znázorněny přirozené detaily jako skvrny na betonu, nerovnosti na chodníku nebo specifické odlesky na zaparkovaných autech. Jejich absence nebo naopak příliš dokonalé provedení může být varovným signálem.

Geografické a architektonické nesmysly: Umělá inteligence občas vytvoří budovy nebo scenérie, které z hlediska architektury nedávají smysl. Okna mohou být v divných pozicích, dveře vedou nikam nebo perspektiva stavby jednoduše nesedí.

Průmyslové standardy a transparentnost obsahu

Google nejde cestou izolovaných řešení, ale aktivně se zapojuje do širší iniciativy za transparentnost digitálního obsahu. Od prosince 2024 začaly obrázky vytvořené pomocí Nano Banana Pro (Gemini 3 Pro Image) obsahovat také C2PA metadata – průmyslový standard, který zaznamenává informace o původu obsahu.

Společnost je součástí řídícího výboru Coalition for Content Provenance and Authenticity (C2PA), organizace spojující technologické firmy v úsilí o větší transparentnost. Google plánuje postupně rozšířit podporu detekce i na obrázky vytvořené nástroji jiných společností, pokud budou používat C2PA standard.

V Google Search už začíná funkce „About this image” zobrazovat informace, pokud obrázek obsahuje C2PA metadata. Uživatelé tak mohou vidět, zda byl snímek vytvořen nebo upraven pomocí AI nástrojů. Podobná integrace probíhá i v reklamních systémech Googlu.

Kam směřuje budoucnost detekce AI obsahu

Zatímco ruční ověřování obsahu v Gemini představuje užitečný krok vpřed, skutečný potenciál C2PA a vodoznaků typu SynthID se naplno projeví až ve chvíli, kdy sociální sítě začnou automaticky označovat AI vytvořený obsah. Namísto toho, aby uživatelé museli sami ověřovat každý obrázek, platformy by mohly preventivně informovat o původu materiálu.

Podle interních testů Googlu dokázala AI Gemini správně identifikovat jak AI obrázky, tak skutečné fotografie. I když technologie není dokonalá, interní testy ukazují přesnost proti mnoha běžným úpravám obrázků.

Do budoucna Google slibuje rozšíření ověřování SynthID i na videa a zvukové nahrávky. Postupně se objeví i v dalších produktech jako Google Search. Cílem je vytvořit ekosystém, kde uživatelé mohou ověřovat původ obsahu bez ohledu na to, jaký nástroj byl použit.

Zdroje: CHIP.cz | The Verge | Google DeepMind Blog | Google Blog | Svět Androida | Google Support

Zůstaňte v obraze s AI novinkami

Přihlaste se k odběru mého newsletteru a získejte nejnovější tipy, triky a novinky ze světa umělé inteligence přímo do vaší schránky. Žádný spam, pouze hodnotný obsah.

Týdenní přehled novinek

Exkluzivní návody

Slevy na workshopy

Name(Required)
Privacy(Required)

Odesláním souhlasíte se zpracováním osobních údajů. Odhlásit se můžete kdykoliv.

Další články

Další zajímavé články, které by vás mohly zajímat

V roce 2026 většina firemních AI projektů zkrachuje a je jen jeden důvod proč

Zatímco jednotlivci dosahují s AI nástroji vyšší produktivity, velké firemní projekty často selhávají ještě před nasazením. Výzkumy varují, že až 90 procent AI iniciativ může v roce 2026 skončit nezdarem. Překvapivě hlavní problém nespočívá v...

Může být AI premiérem České republiky už v roce 2029?

S nedávnými volbami a dynamickým rozvojem umělé inteligence není otázkou, jestli AI zasáhne do politiky, ale kdy a jak. Česko má plán pro rozvoj AI včetně jejího využití ve státní správě do roku 2030, zatímco...

Akt EU o umělé inteligenci: Schváleno! Co to pro nás znamená?

Po dlouhém čekání byl konečně schválen Akt o umělé inteligenci (AI Act), čímž se Evropská unie stává průkopníkem v regulaci této dynamicky se rozvíjející technologie. Ale co to pro nás vlastně znamená? V tomto blogovém...