ZeroSearch: AI, která se učí hledat bez Googlu a šetří peníze

Alibaba přichází s revoluční metodou ZeroSearch, která umožňuje umělé inteligenci naučit se vyhledávat informace bez závislosti na skutečných vyhledávačích. Tato inovace nejen zvyšuje kontrolu nad tréninkem AI, ale hlavně snižuje náklady až o 88 %. Jak to funguje a co to znamená pro budoucnost AI?

ZeroSearch: Nový trénink umělé inteligence

Proč je ZeroSearch průlomem v AI

Vývoj pokročilých AI asistentů, kteří dokážou samostatně vyhledávat informace, byl dosud spojen s vysokými náklady a složitostí. Hlavní překážkou byly poplatky za API komerčních vyhledávačů, jako je Google, a také nekonzistentní kvalita získaných dat. Alibaba tento problém řeší novým přístupem ZeroSearch, který umožňuje modelům trénovat vyhledávací schopnosti bez nutnosti reálného připojení k vyhledávačům.

ZeroSearch staví na myšlence, že velké jazykové modely (LLM) už mají díky předchozímu rozsáhlému tréninku dostatečné znalosti světa. Proto je možné je naučit simulovat výsledky vyhledávání – generovat jak relevantní, tak i nerelevantní dokumenty k dotazu. To zásadně mění přístupy, protože trénink už není omezen vysokými náklady na API a je plně pod kontrolou vývojářů.

Jak ZeroSearch funguje v praxi

Trénink začíná lehkým doškolením modelu, aby se z něj stal tzv. retrieval modul – tedy model, který umí na dotaz vygenerovat různé typy odpovědí, včetně těch méně kvalitních. V další fázi se využívá tzv. „curriculum-based rollout strategy“, což znamená, že AI je postupně vystavována stále méně kvalitním informacím. Tento přístup simuluje reálné internetové prostředí, kde nejsou všechny informace vždy přesné nebo relevantní.

Klíčová je zde schopnost modelu učit se pracovat i s nejednoznačnými nebo protichůdnými daty, což je v praxi velmi cenné. Model se tak stává robustnějším a lépe připraveným na reálné situace, kde musí filtrovat šum a najít správnou odpověď.

Výsledky: Výkon i úspora nákladů

ZeroSearch byl testován na sedmi známých datových sadách pro otázky a odpovědi. Výsledky ukázaly, že model s 7 miliardami parametrů dosáhl srovnatelného výkonu jako Google Search, a větší model s 14 miliardami parametrů jej dokonce překonal. Rozdíl je ale v nákladech: trénink s 64 000 dotazy přes Google Search by stál přibližně 587 dolarů, zatímco ZeroSearch zvládne totéž za 71 dolarů – to je úspora 88 %.

Tato metoda je univerzální – funguje napříč různými rodinami modelů (např. Qwen-2.5, LLaMA-3.2), ať už jde o základní nebo instrukčně laděné varianty. Vývojáři mají navíc plnou kontrolu nad tím, jaká data model během tréninku vidí, což zvyšuje transparentnost a předvídatelnost celého procesu.

Dopady na vývoj AI a budoucnost oboru

ZeroSearch může zásadně změnit ekonomiku vývoje AI. Menší firmy a startupy, které si nemohly dovolit vysoké náklady na API, teď získávají přístup k pokročilému tréninku za zlomek ceny. Zároveň se snižuje závislost na velkých technologických platformách, což podporuje větší otevřenost a inovace v celém ekosystému.

Další výhodou je možnost přesně řídit kvalitu a typ informací, které model během tréninku zpracovává. To znamená, že lze lépe simulovat různé scénáře, včetně těch, kde jsou informace neúplné nebo zavádějící. Výsledkem jsou robustnější a spolehlivější AI asistenti, kteří si poradí i v náročných podmínkách.

Alibaba zpřístupnila kód, datasety i předtrénované modely na GitHubu a Hugging Face, což umožňuje široké komunitě využít tento přístup a dále jej rozvíjet.

Zdroje: VentureBeat | TechRepublic | The Decoder | WinBuzzer | GitHub

Chceš dostávat další tipy o AI?

Přihlas se k odběru a zhruba 2x měsíčně ti pošlu to nejlepší ze světa AI.

Name(Required)
Privacy(Required)

Další články

Nerovnosti v odvětví AI a co s tím může udělat svět

Umělá inteligence má potenciál proměnit až 40 % pracovních míst po celém světě a stát se trhem v hodnotě téměř 5 bilionů dolarů. Přináší však nejen příležitosti, ale i hrozbu prohlubujících se nerovností. Jaké kroky doporučuje OSN, aby AI sloužila všem a nikoliv jen několika vyvoleným?

Celý článek >