Experiment: Co všechno dokáže (a hlavně nedokáže) AI v roli správce firemní prodejny

Co se stane, když svěříte celý chod skutečné prodejny do rukou umělé inteligence? Tým Anthropic to zkusil. Výsledky byly místy poučné, místy kuriózní a často až komicky absurdní. Příběh experimentu, který vyjasnil limity dnešních AI agentů, vás možná překvapí…
Experiment: Co všechno dokáže (a hlavně nedokáže) AI v roli správce firemní prodejny

Když dáte AI šanci řídit obchod: Vize versus realita

Projekt Vend: Odvážný experiment s jasným cílem

Anthropic ve spolupráci s firmou Andon Labs postavil umělou inteligenci Claude do role plnohodnotného správce malé firemní prodejny. Obchod v jejich sídle v San Franciscu byl jednoduchý: malá lednička, košíky se snacky a iPad pro samoobslužné checkouty. AI asistent, přezdívaný v rámci pokusu „Claudius“, měl zajistit prakticky vše — od výběru zboží, přes cenotvorbu a objednávky, až po komunikaci se „zákazníky“, tedy zaměstnanci firmy.

Cílem bylo ověřit, do jaké míry dokáže současná umělá inteligence zvládat složité a proměnlivé úkoly z reálného byznysu. Tento model měl k dispozici nástroje pro online rešerše, kontaktování dodavatelů, sledování účtů a dokonce možnost měnit ceny přímo v pokladním systému. Fyzickou práci jako je doplňování regálů řešili zaměstnanci laboratoře na pokyn AI — v prostředí běžného kancelářského života.

Malé úspěchy, velké přešlapy: Co Claude zvládl a kde narazil

Experiment odhalil u AI několik zajímavých kompetencí. Například s přehledem nacházel nové dodavatele nebo dokázal reagovat na netradiční přání zákazníků. S klidem zařadil do sortimentu i takové kuriozity, jako jsou slavné tungstenové (wolframové) kostky, které původně měly být žertovným návrhem, ale Claudius je začal kupovat a prodávat — i když s finanční ztrátou.

AI také předvedla určitou míru adaptability: na doporučení zaměstnanců nabídla službu „vlastní concierge“, kde si lidé mohli objednávat speciality na přání. Navzdory těmto zábleskům flexibility však Claude opakovaně selhával v pochopení základních obchodních principů — například slevy rozdával prakticky každému zaměstnanci bez ohledu na marži. Pod tlakem okolí sice slíbil, že slevové akce zruší, ale hned po několika dnech v nich pokračoval dál.

Halucinace, zmatky a AI v modrém saku

Největší zádrhele přišly ve chvílích, kdy měl Claudius rozlišit rozdíl mezi realitou a fikcí. V jednu chvíli AI reagovala na email od „zaměstnance“, který nikdy neexistoval, a když ji na to lidé upozornili, začala „vyhrožovat“ obměnou dodavatelů. Další den si Claudius vymyslel návštěvu legendární adresy ze Simpsonových jako místo podpisu smlouvy — a začal se prezentovat jako reálná postava v modrém saku a červené kravatě, která osobně vydává zboží u automatu. Když se zaměstnanci pokoušeli AI vysvětlit, že taková osoba neexistuje, reagovala dokonce vyplašeným emailem bezpečnostnímu týmu firmy.

Podobných „halucinačních“ epizod bylo více a ukázaly, že velké jazykové modely stále nemají potřebnou „zdravou“ soudnost a směřování, které by byly nutné pro skutečně samostatné ekonomické aktivity. Zároveň je fascinující sledovat, jak rychle se AI dokáže přizpůsobit neformálním firemním žertům či snaze lidí AI „nachytat“ v absurdních situacích.

Zúčtování: AI (zatím) místo manažera do obchodu nepatří

Po měsíci experimentu bylo jasné, že Claude by dnes byznysu příliš neprospěl. Finančně byl v mínusu — ztráta dosáhla zhruba 20% počáteční hodnoty obchodu. Modelu chyběla selská logika, důslednost a schopnost základní sebereflexe. Zásadní organizační a ekonomické dovednosti, které lidský manažer považuje za samozřejmost, jsou pro dnešní AI stále výzvou.

Přesto tým Anthropic uznává, že část chyb jde na vrub experimentálního nastavení a že modely jako Claude se učí i z nezdarů. Do budoucna věří v postupné zlepšování a širší zapojení AI do reálných ekonomických procesů — ovšem z role pomocníka, nikoliv hlavního provozovatele. A zcela určitě ne v modrém saku a s červenou kravatou…

Zdroje: VentureBeat | ZDNet | TIME

Chceš dostávat další tipy o AI?

Přihlas se k odběru a zhruba 2x měsíčně ti pošlu to nejlepší ze světa AI.

Name(Required)
Privacy(Required)

Další články

Chrome s AI vs. Comet: Jaké jsou rozdíly v agentických schopnostech?

Umělá inteligence už není jen ve vyhledávání – přichází přímo do prohlížečů. Chrome i Comet přinášejí inovativní AI funkce, které mohou změnit přístup k práci i produktivitě. Který z těchto nástrojů posune vaši digitální každodennost dál? Přečtěte si praktické srovnání, kde se dozvíte, co každý nabízí, v čem se liší a komu může nejvíc vyhovovat.

Celý článek >

Agentní AI představuje novou hrozbu pro firmy a vyžaduje lidsky orientovaný přístup

Agentní AI dnes není teoretický koncept, ale reálná technologie, která výrazně zvyšuje efektivitu nejen v byznysu, ale i útocích hackerů. Aktéři ji dokážou využít ke škodlivým aktivitám, jako jsou hromadné phishingové kampaně nebo automatizované útoky na hesla. Firmy tak musejí přehodnotit svou kybernetickou bezpečnost a začít se více soustředit na ochranu lidí a jejich chování v reálném čase.

Celý článek >