Co je version drift v AI a proč vzniká
Version drift označuje jev, kdy v organizaci vznikají a zůstávají v oběhu neoficiální kopie dokumentů, které už nejsou aktualizovány a postupně zastarávají. K tomu často dochází například při používání funkce „Uložit jako“ nebo rozesíláním souborů e-mailem namísto sdílení odkazů z centrálního systému. Takových kopií se pak během času nahromadí velké množství, vzniká tak „roztříštěný“ informační prostor.
AI systémy, které při vyhledávání relevantních informací používají semantic matching, nerozlišují mezi aktuální a zastaralou verzí dokumentu. Pro AI je obsah značně podobný, a proto vybírá náhodně mezi různými verzemi, což může vést k tomu, že uživatel dostane přesnou, ale již neplatnou informaci. Tento efekt je oproti klasickým hallucinacím AI mnohem zákeřnější, protože systém působí kompetentně, ale dává chybná data.
Rizika pro firmy a zaměstnance
Zatímco AI „halucinace“ znamenají výrobu nepravdivých faktů, version drift přináší skutečná, ale zastaralá data. Tento stav může mít vážné dopady, například v regulovaných odvětvích, kde zastaralé návody či postupy ohrožují bezpečnost, nebo v situacích, kdy zákaznický chatbot podá nesprávné informace kvůli použití staré politiky firmy.
Pro zaměstnance představuje version drift ztrátu důvěry v AI nástroje, protože systém často přehlíží lidské standardy jako ověření data či schválení dokumentu. Pokud AI nedokáže správně posoudit aktuálnost informací, zaměstnanci ji v kritických situacích přestanou brát vážně.
Jak AI rozpoznává verze dokumentů (a jak ne)
Tradiční AI systémy na bázi retrieval-augmented generation (RAG) fungují tak, že vyhledávají dokumenty podle obsahové podobnosti bez analýzy metadat. To znamená, že varianty dokumentů označené například jako „návrh“, „finální“ nebo „schválené“ pro AI ztrácejí svůj význam, protože nevyhodnocuje jejich stav či datum vydání.
Lidé při hledání informací přirozeně posuzují, kterou verzi použít, na základě názvu souboru, data nebo statusu. AI bez těchto kroků vybírá z dostupných verzí náhodně, což může vést ke konfliktům mezi různými odpověďmi i reálným škodám pro firmu.
Řešení verze drift: řetězové uvažování a metadata
Nejúčinnější obrana proti version drift je zavedení tzv. chain-of-thought, tedy řetězového uvažování v AI, kdy systém pracuje ve třech krocích:
- Nejdříve sesbírá všechny relevantní dokumenty z dostupných zdrojů
- Následně vyhodnotí jejich metadata (datum, stav schválení, verzi)
- Nakonec vybere nejaktuálnější a nejautoritativnější verzi a uživateli ji předloží včetně zdůvodnění výběru
Nástroje jako LangChain nebo LlamaIndex umožňují tuto metodiku implementovat, čímž AI získává lidský způsob uvažování o zdrojích informací a eliminuje nechtěná rizika.
Praktická opatření pro firmy
Aby AI mohla správně posuzovat aktuálnost dokumentů, firmy musí mít v dokumentech kvalitně vedená metadata a jasné schvalovací postupy. Bez těchto dat nelze spolehlivě určit, která verze je ta pravá. Proto je vhodné pravidelně provádět „ambiguitní stres test“ – zkontrolovat, zda různé verze dokumentů v organizaci nekolidují a nehrozí záměny.
Díky tomu se snižuje riziko, že AI při odpovědi na důležitou otázku použije chybné nebo staré informace, což posiluje důvěru zaměstnanců a snižuje právní či provozní rizika.
Důvěra v AI a transparentnost výběru zdrojů
Nakonec je klíčové, aby AI nebyla jen nástrojem, který dává odpovědi, ale aby uživatelům transparentně vysvětlovala, proč a jak vybrala konkrétní dokument. Například: „Vybral jsem finální verzi z Q1 2025, protože je nejnovější a schválená.“
Tento přístup posiluje důvěru uživatelů v systém a umožňuje nasazení AI do kritických podnikových procesů, kde chyba může vést k vysokým nákladům. V regulovaných sektorech navíc auditovatelné výběry zdrojů často vyžaduje zákon, což činí zavedení řetězového uvažování nezbytností.
Zdroj: TechRadar Pro


