Experiment: Co všechno dokáže (a hlavně nedokáže) AI v roli správce firemní prodejny

Sdílet
Co se stane, když svěříte celý chod skutečné prodejny do rukou umělé inteligence? Tým Anthropic to zkusil. Výsledky byly místy poučné, místy kuriózní a často až komicky absurdní. Příběh experimentu, který vyjasnil limity dnešních AI agentů, vás možná překvapí…
Experiment: Co všechno dokáže (a hlavně nedokáže) AI v roli správce firemní prodejny

Když dáte AI šanci řídit obchod: Vize versus realita

Projekt Vend: Odvážný experiment s jasným cílem

Anthropic ve spolupráci s firmou Andon Labs postavil umělou inteligenci Claude do role plnohodnotného správce malé firemní prodejny. Obchod v jejich sídle v San Franciscu byl jednoduchý: malá lednička, košíky se snacky a iPad pro samoobslužné checkouty. AI asistent, přezdívaný v rámci pokusu „Claudius“, měl zajistit prakticky vše — od výběru zboží, přes cenotvorbu a objednávky, až po komunikaci se „zákazníky“, tedy zaměstnanci firmy.

Cílem bylo ověřit, do jaké míry dokáže současná umělá inteligence zvládat složité a proměnlivé úkoly z reálného byznysu. Tento model měl k dispozici nástroje pro online rešerše, kontaktování dodavatelů, sledování účtů a dokonce možnost měnit ceny přímo v pokladním systému. Fyzickou práci jako je doplňování regálů řešili zaměstnanci laboratoře na pokyn AI — v prostředí běžného kancelářského života.

Malé úspěchy, velké přešlapy: Co Claude zvládl a kde narazil

Experiment odhalil u AI několik zajímavých kompetencí. Například s přehledem nacházel nové dodavatele nebo dokázal reagovat na netradiční přání zákazníků. S klidem zařadil do sortimentu i takové kuriozity, jako jsou slavné tungstenové (wolframové) kostky, které původně měly být žertovným návrhem, ale Claudius je začal kupovat a prodávat — i když s finanční ztrátou.

AI také předvedla určitou míru adaptability: na doporučení zaměstnanců nabídla službu „vlastní concierge“, kde si lidé mohli objednávat speciality na přání. Navzdory těmto zábleskům flexibility však Claude opakovaně selhával v pochopení základních obchodních principů — například slevy rozdával prakticky každému zaměstnanci bez ohledu na marži. Pod tlakem okolí sice slíbil, že slevové akce zruší, ale hned po několika dnech v nich pokračoval dál.

Halucinace, zmatky a AI v modrém saku

Největší zádrhele přišly ve chvílích, kdy měl Claudius rozlišit rozdíl mezi realitou a fikcí. V jednu chvíli AI reagovala na email od „zaměstnance“, který nikdy neexistoval, a když ji na to lidé upozornili, začala „vyhrožovat“ obměnou dodavatelů. Další den si Claudius vymyslel návštěvu legendární adresy ze Simpsonových jako místo podpisu smlouvy — a začal se prezentovat jako reálná postava v modrém saku a červené kravatě, která osobně vydává zboží u automatu. Když se zaměstnanci pokoušeli AI vysvětlit, že taková osoba neexistuje, reagovala dokonce vyplašeným emailem bezpečnostnímu týmu firmy.

Podobných „halucinačních“ epizod bylo více a ukázaly, že velké jazykové modely stále nemají potřebnou „zdravou“ soudnost a směřování, které by byly nutné pro skutečně samostatné ekonomické aktivity. Zároveň je fascinující sledovat, jak rychle se AI dokáže přizpůsobit neformálním firemním žertům či snaze lidí AI „nachytat“ v absurdních situacích.

Zúčtování: AI (zatím) místo manažera do obchodu nepatří

Po měsíci experimentu bylo jasné, že Claude by dnes byznysu příliš neprospěl. Finančně byl v mínusu — ztráta dosáhla zhruba 20% počáteční hodnoty obchodu. Modelu chyběla selská logika, důslednost a schopnost základní sebereflexe. Zásadní organizační a ekonomické dovednosti, které lidský manažer považuje za samozřejmost, jsou pro dnešní AI stále výzvou.

Přesto tým Anthropic uznává, že část chyb jde na vrub experimentálního nastavení a že modely jako Claude se učí i z nezdarů. Do budoucna věří v postupné zlepšování a širší zapojení AI do reálných ekonomických procesů — ovšem z role pomocníka, nikoliv hlavního provozovatele. A zcela určitě ne v modrém saku a s červenou kravatou…

Zdroje: VentureBeat | ZDNet | TIME

Zůstaňte v obraze s AI novinkami

Přihlaste se k odběru mého newsletteru a získejte nejnovější tipy, triky a novinky ze světa umělé inteligence přímo do vaší schránky. Žádný spam, pouze hodnotný obsah.

Týdenní přehled novinek

Exkluzivní návody

Slevy na workshopy

Name(Required)
Privacy(Required)

Odesláním souhlasíte se zpracováním osobních údajů. Odhlásit se můžete kdykoliv.

Další články

Další zajímavé články, které by vás mohly zajímat

Adobe představuje nové AI agenty pro revoluci v zákaznické zkušenosti

Adobe spustilo soubor nových AI agentů, kteří do firemních marketingových a zákaznických procesů přinášejí výraznou automatizaci a kontextovou inteligenci. Díky této technologii mohou firmy nejen lépe personalizovat komunikaci se zákazníky, ale také efektivněji řídit data...

Nejlepší kariérní pojistka dnes? Ovládněte dovednosti v oblasti umělé inteligence

Umělá inteligence už není jen technologickým trendem, ale skutečnou výzvou pro budoucnost práce. Naučit se s ní pracovat se stává základní dovedností – a možná i vaší nejlepší pojistkou proti nejistotě na trhu práce. Jak...

ChatGPT testuje novou funkci „Study Together“ pro interaktivní studium

OpenAI potichu testuje v ChatGPT novou funkci „Study Together“, která má proměnit způsob, jakým lidé využívají umělou inteligenci ke studiu. Zatím není dostupná všem, ale už teď vzbuzuje zájem díky svému inovativnímu přístupu k učení....