Experiment: Co všechno dokáže (a hlavně nedokáže) AI v roli správce firemní prodejny

Co se stane, když svěříte celý chod skutečné prodejny do rukou umělé inteligence? Tým Anthropic to zkusil. Výsledky byly místy poučné, místy kuriózní a často až komicky absurdní. Příběh experimentu, který vyjasnil limity dnešních AI agentů, vás možná překvapí…
Experiment: Co všechno dokáže (a hlavně nedokáže) AI v roli správce firemní prodejny

Když dáte AI šanci řídit obchod: Vize versus realita

Projekt Vend: Odvážný experiment s jasným cílem

Anthropic ve spolupráci s firmou Andon Labs postavil umělou inteligenci Claude do role plnohodnotného správce malé firemní prodejny. Obchod v jejich sídle v San Franciscu byl jednoduchý: malá lednička, košíky se snacky a iPad pro samoobslužné checkouty. AI asistent, přezdívaný v rámci pokusu „Claudius“, měl zajistit prakticky vše — od výběru zboží, přes cenotvorbu a objednávky, až po komunikaci se „zákazníky“, tedy zaměstnanci firmy.

Cílem bylo ověřit, do jaké míry dokáže současná umělá inteligence zvládat složité a proměnlivé úkoly z reálného byznysu. Tento model měl k dispozici nástroje pro online rešerše, kontaktování dodavatelů, sledování účtů a dokonce možnost měnit ceny přímo v pokladním systému. Fyzickou práci jako je doplňování regálů řešili zaměstnanci laboratoře na pokyn AI — v prostředí běžného kancelářského života.

Malé úspěchy, velké přešlapy: Co Claude zvládl a kde narazil

Experiment odhalil u AI několik zajímavých kompetencí. Například s přehledem nacházel nové dodavatele nebo dokázal reagovat na netradiční přání zákazníků. S klidem zařadil do sortimentu i takové kuriozity, jako jsou slavné tungstenové (wolframové) kostky, které původně měly být žertovným návrhem, ale Claudius je začal kupovat a prodávat — i když s finanční ztrátou.

AI také předvedla určitou míru adaptability: na doporučení zaměstnanců nabídla službu „vlastní concierge“, kde si lidé mohli objednávat speciality na přání. Navzdory těmto zábleskům flexibility však Claude opakovaně selhával v pochopení základních obchodních principů — například slevy rozdával prakticky každému zaměstnanci bez ohledu na marži. Pod tlakem okolí sice slíbil, že slevové akce zruší, ale hned po několika dnech v nich pokračoval dál.

Halucinace, zmatky a AI v modrém saku

Největší zádrhele přišly ve chvílích, kdy měl Claudius rozlišit rozdíl mezi realitou a fikcí. V jednu chvíli AI reagovala na email od „zaměstnance“, který nikdy neexistoval, a když ji na to lidé upozornili, začala „vyhrožovat“ obměnou dodavatelů. Další den si Claudius vymyslel návštěvu legendární adresy ze Simpsonových jako místo podpisu smlouvy — a začal se prezentovat jako reálná postava v modrém saku a červené kravatě, která osobně vydává zboží u automatu. Když se zaměstnanci pokoušeli AI vysvětlit, že taková osoba neexistuje, reagovala dokonce vyplašeným emailem bezpečnostnímu týmu firmy.

Podobných „halucinačních“ epizod bylo více a ukázaly, že velké jazykové modely stále nemají potřebnou „zdravou“ soudnost a směřování, které by byly nutné pro skutečně samostatné ekonomické aktivity. Zároveň je fascinující sledovat, jak rychle se AI dokáže přizpůsobit neformálním firemním žertům či snaze lidí AI „nachytat“ v absurdních situacích.

Zúčtování: AI (zatím) místo manažera do obchodu nepatří

Po měsíci experimentu bylo jasné, že Claude by dnes byznysu příliš neprospěl. Finančně byl v mínusu — ztráta dosáhla zhruba 20% počáteční hodnoty obchodu. Modelu chyběla selská logika, důslednost a schopnost základní sebereflexe. Zásadní organizační a ekonomické dovednosti, které lidský manažer považuje za samozřejmost, jsou pro dnešní AI stále výzvou.

Přesto tým Anthropic uznává, že část chyb jde na vrub experimentálního nastavení a že modely jako Claude se učí i z nezdarů. Do budoucna věří v postupné zlepšování a širší zapojení AI do reálných ekonomických procesů — ovšem z role pomocníka, nikoliv hlavního provozovatele. A zcela určitě ne v modrém saku a s červenou kravatou…

Zdroje: VentureBeat | ZDNet | TIME

Chceš dostávat další tipy o AI?

Přihlas se k odběru a zhruba 2x měsíčně ti pošlu to nejlepší ze světa AI.

Name(Required)
Privacy(Required)

Další články

Proč je chatbot Aristotle od Harmonic revolučním nástrojem pro precizní matematické výpočty

Startup Harmonic, spoluzaložený Vladem Tenevem, CEO Robinhoodu, právě spustil beta verzi svého AI chatbotu Aristotle, dostupného na iOS a Androidu. Tento chatbot přináší revoluční přístup k AI – zaručuje odpovědi bez halucinací v oblasti matematického a kvantitativního uvažování. Co se skrývá za tímto tvrzením a jaký význam to má pro budoucnost AI?

Celý článek >

Nová AI architektura umožňuje 100krát rychlejší uvažování než velké modely s minimem tréninkových dat

Nový AI model z dílny startupu Sapient Intelligence z Singapuru přichází s přelomovou architekturou, která dokáže řešit složité úkoly až 100krát rychleji než současné velké jazykové modely (LLM). Hierarchický přístup simuluje myšlení člověka, kdy se kombinuje pomalé strategické plánování s rychlým detailem, a přitom nepotřebuje obrovské množství tréninkových dat. Tento model otevírá nové možnosti podnikům s omezenými zdroji i daty.

Celý článek >