Nová AI architektura umožňuje 100krát rychlejší uvažování než velké modely s minimem tréninkových dat

Nový AI model z dílny startupu Sapient Intelligence z Singapuru přichází s přelomovou architekturou, která dokáže řešit složité úkoly až 100krát rychleji než současné velké jazykové modely (LLM). Hierarchický přístup simuluje myšlení člověka, kdy se kombinuje pomalé strategické plánování s rychlým detailem, a přitom nepotřebuje obrovské množství tréninkových dat. Tento model otevírá nové možnosti podnikům s omezenými zdroji i daty.
Nová AI architektura umožňuje 100krát rychlejší uvažování než velké modely s minimem tréninkových dat

Hierarchické uvažování inspirované mozkem

Nová architektura nazvaná Hierarchical Reasoning Model (HRM) vznikla v startupu Sapient Intelligence v Singapuru. Její hlavní inspirací je způsob, jakým lidský mozek kombinuje pomalé, systematické plánování s rychlými, instinktivními reakcemi. Model HRM využívá dvě na sobě závislé moduly – jeden pracuje na abstraktním, pomalém a velkém plánu, zatímco druhý řeší detailní výpočty rychle a lokálně.

Tento přístup umožňuje systému postupně přistupovat k problému pomocí tzv. hierarchické konvergence, kdy rychlý modul řeší dílčí části do stabilního výsledku, a pomalý modul aktualizuje strategii a zadává nové podproblémy. Díky tomu model nevstupuje do příliš rychlé konvergence a nepřichází o kvalitu řešení, zároveň se však vyhýbá problémům jako „zanikající gradient“ u hlubokých sítí.

Výkonnost a efektivita bez velkých dat

HRM dosahuje vysoké přesnosti, a to i u náročných úloh jako jsou složité sudoku, labyrinty nebo benchmark ARC-AGI testující kombinaci uvažování a generalizace. Zatímco nejmodernější LLM postavené na řetězovém myšlení (Chain-of-Thought) zcela selhávají, HRM dosahuje téměř dokonalých výsledků s pouhými 1 000 tréninkovými příklady.

Tento model nevyužívá tradiční metodu “řekni si nahlas”, kdy LLM tokenově rozkládají myšlenky, což je náročné na data a pomalé. Místo toho aplikuje tzv. latentní uvažování, kdy myšlení probíhá v abstraktním vnitřním prostoru, zrychluje vyhodnocování a snižuje potřebu dat a paměti.

Praktické přínosy a obchodní využití

HRM svojí efektivitou slibuje až 100násobné zrychlení vyhodnocování úloh oproti současným LLM, což znamená výrazné snížení latence i nákladů na výpočet. To ji činí ideální pro aplikace na hraně s omezenými zdroji, například v robotice, logistice, lékařském výzkumu nebo průmyslové diagnostice, kde nemáme k dispozici rozsáhlé datové sady ani nadměrné výpočetní kapacity.

Podle zakladatele Sapient Intelligence, Guana Wanga, je tato nová architektura perspektivní zejména pro složité, sekvenční rozhodovací úkoly a dlouhodobé plánování, kde současné LLM narážejí na pomalost či chyby. Trénink HRM na sudoku ukázal, že model dokáže postupně zlepšovat svou efektivitu a učit se řešení stále rychleji, jako když se člověk vypracuje z nováčka na experta.

Startup navíc pracuje na rozšíření využití HRM směrem k univerzálním, samoopravujícím se modelům pro zdravotnictví, klimatické předpovědi či robotiku, což potvrzuje potenciál inovace k dalšímu rozvoji inteligentních systémů mimo čistě jazykové modely.

Zdroje: VentureBeat | Future | LinkedIn (Simon Manna)

Chceš dostávat další tipy o AI?

Přihlas se k odběru a zhruba 2x měsíčně ti pošlu to nejlepší ze světa AI.

Name(Required)
Privacy(Required)

Další články

Proč je chatbot Aristotle od Harmonic revolučním nástrojem pro precizní matematické výpočty

Startup Harmonic, spoluzaložený Vladem Tenevem, CEO Robinhoodu, právě spustil beta verzi svého AI chatbotu Aristotle, dostupného na iOS a Androidu. Tento chatbot přináší revoluční přístup k AI – zaručuje odpovědi bez halucinací v oblasti matematického a kvantitativního uvažování. Co se skrývá za tímto tvrzením a jaký význam to má pro budoucnost AI?

Celý článek >

Jak stínová AI zvyšuje náklady na únik dat a co s tím mohou firmy dělat

Stínová AI, tedy neautorizované či neviditelné využívání umělé inteligence v organizacích, se stává výrazným bezpečnostním rizikem s náklady vyššími o 670 tisíc dolarů na bezpečnostní incident. Přes rychlý nástup AI vůbec většina firem nemá zavedené základní kontroly ani auditní procesy, což je pro hackery příležitost ke scénářům s hlubokou škodlivostí. Článek rozebírá nejnovější data ze studie IBM, která přináší jasná doporučení, jak situaci řešit.

Celý článek >