Hierarchické uvažování inspirované mozkem
Nová architektura nazvaná Hierarchical Reasoning Model (HRM) vznikla v startupu Sapient Intelligence v Singapuru. Její hlavní inspirací je způsob, jakým lidský mozek kombinuje pomalé, systematické plánování s rychlými, instinktivními reakcemi. Model HRM využívá dvě na sobě závislé moduly – jeden pracuje na abstraktním, pomalém a velkém plánu, zatímco druhý řeší detailní výpočty rychle a lokálně.
Tento přístup umožňuje systému postupně přistupovat k problému pomocí tzv. hierarchické konvergence, kdy rychlý modul řeší dílčí části do stabilního výsledku, a pomalý modul aktualizuje strategii a zadává nové podproblémy. Díky tomu model nevstupuje do příliš rychlé konvergence a nepřichází o kvalitu řešení, zároveň se však vyhýbá problémům jako „zanikající gradient“ u hlubokých sítí.
Výkonnost a efektivita bez velkých dat
HRM dosahuje vysoké přesnosti, a to i u náročných úloh jako jsou složité sudoku, labyrinty nebo benchmark ARC-AGI testující kombinaci uvažování a generalizace. Zatímco nejmodernější LLM postavené na řetězovém myšlení (Chain-of-Thought) zcela selhávají, HRM dosahuje téměř dokonalých výsledků s pouhými 1 000 tréninkovými příklady.
Tento model nevyužívá tradiční metodu “řekni si nahlas”, kdy LLM tokenově rozkládají myšlenky, což je náročné na data a pomalé. Místo toho aplikuje tzv. latentní uvažování, kdy myšlení probíhá v abstraktním vnitřním prostoru, zrychluje vyhodnocování a snižuje potřebu dat a paměti.
Praktické přínosy a obchodní využití
HRM svojí efektivitou slibuje až 100násobné zrychlení vyhodnocování úloh oproti současným LLM, což znamená výrazné snížení latence i nákladů na výpočet. To ji činí ideální pro aplikace na hraně s omezenými zdroji, například v robotice, logistice, lékařském výzkumu nebo průmyslové diagnostice, kde nemáme k dispozici rozsáhlé datové sady ani nadměrné výpočetní kapacity.
Podle zakladatele Sapient Intelligence, Guana Wanga, je tato nová architektura perspektivní zejména pro složité, sekvenční rozhodovací úkoly a dlouhodobé plánování, kde současné LLM narážejí na pomalost či chyby. Trénink HRM na sudoku ukázal, že model dokáže postupně zlepšovat svou efektivitu a učit se řešení stále rychleji, jako když se člověk vypracuje z nováčka na experta.
Startup navíc pracuje na rozšíření využití HRM směrem k univerzálním, samoopravujícím se modelům pro zdravotnictví, klimatické předpovědi či robotiku, což potvrzuje potenciál inovace k dalšímu rozvoji inteligentních systémů mimo čistě jazykové modely.
Zdroje: VentureBeat | Future | LinkedIn (Simon Manna)