Hlasové deepfaky neoklamou váš sluchový systém, jen vaše vědomí

Sdílet
Nový výzkum ukazuje, že lidé vědomě nedokážou rozlišit AI hlas od lidského. Mozek to ale zvládá sám. Neurologové pomocí EEG zjistili, že sluchový systém po krátkém tréninku začne falešné hlasy „označovat" jinak než skutečné, a to dávno před tím, než to člověk vědomě zaregistruje. Co to znamená pro budoucí obranu proti hlasovým podvodům?
Hlasové deepfaky neoklamou váš sluchový systém, jen vaše vědomí

Dokážete rozlišit skutečný lidský hlas od hlasu vytvořeného umělou inteligencí? Pravděpodobně ne. A nejste v tom sami. Nová studie zveřejněná v časopise eNeuro ale přináší nečekaně povzbudivé zjištění: i když vědomě selháváte, váš mozek už na rozpoznávání AI hlasů tiše pracuje.

Výzkumný tým pod vedením Xiangbin Tenga z Tianjinské univerzity a Čínské univerzity v Hongkongu provedl experiment s třiceti účastníky. Každý z nich poslouchal věty namluvené skutečnými lidmi a jejich AI kopie vytvořené pomocí systému GPT-SoVITS. Úkolem bylo určit, zda hlas patří člověku, nebo stroji. Výsledky na úrovni vědomého rozhodování? Tristní. Účastníci v tom měli úspěšnost srovnatelnou s náhodným hádáním.

Zajímavější příběh se ale odehrával pod povrchem.

Mozek pracuje dřív než vědomí

Během experimentu nosili účastníci EEG čepice, které snímaly jejich mozkovou aktivitu. A právě tady se ukázalo něco pozoruhodného. Po pouhých dvanácti minutách krátkého perceptuálního tréninku (kdy byly hlasy explicitně označeny jako lidské nebo umělé) začal mozek reagovat na AI hlasy měřitelně jiným způsobem.

Výzkumníci identifikovali tři klíčové okamžiky, ve kterých se neuronální odpovědi na skutečný a syntetický hlas lišily: přibližně 55 milisekund, 210 milisekund a 455 milisekund po začátku zvuku. Všechny tři momenty spadají do raných fází sluchového zpracování, tedy daleko před tím, než se zapojí vědomé rozhodování. Jinými slovy, sluchový systém začne falešné hlasy „tagovat” jako odlišné, ale tato informace se zatím nepropojí s vědomou schopností říci „tohle je AI”.

V čem se AI hlasy liší

Součástí studie byla i akustická analýza samotných hlasových vzorků. Rozdíly mezi skutečnou a syntetickou řečí se ukázaly v rozmezí modulačních frekvencí 5,4 až 11,7 Hz. Toto frekvenční pásmo souvisí s tím, jak mozek sleduje rychlé řečové detaily, tedy jednotlivé fonémy a začátky slabik.

AI hlasy, a to i ty jemně doladěné (tzv. fine-tuned), tyto jemné variace zatím neumí dokonale napodobit. Právě v nich se skrývá jakýsi „akustický otisk”, který lidský sluchový systém zachytí, přestože si to jeho majitel neuvědomuje.

Proč je to dobrá zpráva

Výsledky studie mají důležitý praktický rozměr. Hlasové deepfaky představují reálnou hrozbu, od podvodných telefonátů přes manipulativní audionahrávky až po falšování identity. Zatímco současné technické detektory deepfaků čelí neustálému závodu s vylepšujícími se generátory, lidský mozek nabízí alternativní cestu.

Klíčové zjištění spočívá v tom, že biologický „hardware” pro rozpoznávání falešných hlasů funguje. Chybí ale propojení mezi nevědomou detekcí a vědomým rozhodnutím. To otevírá prostor pro vývoj cílených tréninkových programů, které by lidem pomohly vědomě rozpoznat to, co jejich mozek už zachytil.

Místo obecných rad typu „buďte opatrní při telefonátech” by tak v budoucnu mohly vzniknout konkrétní tréninkové metody zaměřené na specifické akustické znaky, které AI hlasy zatím nedokážou simulovat. Teoreticky by mohly pomoci i techniky neurofeedbacku, které by posílily propojení mezi nevědomou neuronální reakcí a vědomou percepcí.

Závod pokračuje

Je třeba dodat, že studie pracovala s konkrétním generátorem AI hlasů (GPT-SoVITS) a relativně malým vzorkem třiceti lidí. Syntetické hlasové technologie se navíc neustále zdokonalují. Frekvenční pásmo, ve kterém dnes AI hlasy zaostávají, může být překonáno další generací modelů.

Přesto je zjištění zásadní: lidský sluchový systém je ve zpracování řeči mimořádně sofistikovaný a dokáže zachytit nuance, které vědomému vnímání zatím unikají. Výzva teď stojí před neurovědou i bezpečnostním výzkumem: jak tuto skrytou schopnost mozku přetavit v praktický nástroj obrany.

Zdroj: Digital Trends

Zůstaňte v obraze s AI novinkami

Přihlaste se k odběru mého newsletteru a získejte nejnovější tipy, triky a novinky ze světa umělé inteligence přímo do vaší schránky. Žádný spam, pouze hodnotný obsah.

Týdenní přehled novinek

Exkluzivní návody

Slevy na workshopy

Name(Required)
Privacy(Required)

Odesláním souhlasíte se zpracováním osobních údajů. Odhlásit se můžete kdykoliv.

Další články

Další zajímavé články, které by vás mohly zajímat

ESM3: Umělá inteligence, která navrhla nový stavební kámen života 

Americký startup EvolutionaryScale vytvořil umělou inteligenci ESM3. Generativní AI model ESM3 na základě rozsáhlé databáze již známých proteinů navrhl novou sekvenci a strukturu proteinu, který je teď známý jako zelený fluorescenční protein esmGFP. Od nejbližších...

Nový režim Copilot v Edge přináší AI, která aktivně pomáhá při online úlohách

Microsoft přichází s novým experimemtálním režimem Copilot Mode v prohlížeči Edge, který využívá agentní AI schopnosti. Namísto běžného pasivního prohlížení internetu vám AI nabídne aktivní asistenci – od porozumění obsahu na více záložkách po hlasové...

PRŮZKUM: Jak různé věkové skupiny využívají umělou inteligenci v běžném životě

Umělá inteligence už dávno není hudbou vzdálené budoucnosti, ale běžnou součástí našich životů, ať už si to uvědomujeme, nebo ne. Zatímco nejmladší generace ji bere jako samozřejmý nástroj pro školu i zábavu, starší ročníky jsou...