1:0 pro lidstvo: AI zatím živé zaměstnance nenahradí, ukázal experiment vědců

Nahradí umělá inteligence v blízké době lidské zaměstnance? Výzkum z prestižní Carnegie Mellon University ukazuje, že současné AI modely mají k plné autonomii v kanceláři ještě hodně daleko. Jak probíhal a jaké byly jeho výsledky? Čtěte v článku dále.
1:0 pro lidstvo: AI zatím živé zaměstnance nenahradí, ukázal experiment vědců

Experiment: Virtuální firma řízená AI

Vědci z Carnegie Mellon vytvořili simulovanou firmu se vším, co k modernímu podniku patří – interní weby, chatovací platformu ve stylu Slacku a digitální „kolegy“ v rolích personalisty nebo technického ředitele. Do této firmy nasadili několik špičkových AI modelů (včetně Claude od Anthropic, Gemini od Googlu a ChatGPT od OpenAI) a zadali jim běžné úkoly z oblasti financí, administrativy i softwarového vývoje.

Spektrum úloh bylo široké: od analýzy databází kavárenského řetězce přes shromažďování zpětné vazby o výkonnosti inženýrů, psaní hodnoticích zpráv až po výběr nejvhodnějších kanceláří na základě videoprohlídek a posouzení jejich vybavení pro zdraví zaměstnanců.

Výsledky: AI zvládla jen zlomek úkolů

Výsledky byly jednoznačné – a pro AI nepříznivé. Nejlepší model (Claude) dokázal úspěšně dokončit jen necelou čtvrtinu zadaných úkolů, ostatní modely včetně Gemini a ChatGPT zvládly sotva desetinu. V žádné kategorii zadání se AI agentům nepodařilo splnit většinu úkolů, což podle profesora Grahama Neubiga, spoluautora studie, výrazně zpochybňuje představu o rychlém nástupu plně automatizovaných kanceláří.

Proč AI selhává? Chybí selský rozum i sociální dovednosti

Studie odhalila, že současné AI systémy postrádají základní „selský rozum“ a selhávají v situacích, které by člověk vyřešil snadno a intuitivně. Typickým příkladem byl AI agent, který nedokázal zavřít jednoduché vyskakovací okno, nebo si v podnikovém chatu místo nalezení správné osoby vytvořil nového uživatele se stejným jménem. Někteří agenti nepochopili formát zadání, nedokázali vložit odpovědi do připravených dokumentů, nebo předčasně označili úkol za splněný, i když nebyl hotový. Výsledkem byl chaos a neplnění termínů.

Firmy AI chtějí, ale zatím jen jako podporu

Navzdory těmto limitům zůstává zájem o AI agenty ve firmách vysoký. Průzkum společnosti Deloitte ukázal, že více než čtvrtina podniků zkoumá možnosti nasazení autonomních agentů ve velkém. O agentních systémech mluví i šéfové technologických gigantů jako Salesforce nebo Nvidia. Realita je však zatím střízlivější: současné AI systémy si nevědí rady s komplexními podniky a chybějí jim sociální dovednosti, které jsou klíčové například v HR nebo žurnalistice.

Ani firmy, které s AI agenty slaví dílčí úspěchy, se zatím neodvážily odstavit lidi na vedlejší kolej. Společnost Moody’s experimentuje s AI pro rychlejší analýzu finančních výkazů, Johnson & Johnson využívá AI asistenty ke zkrácení doby chemických procesů při vývoji léků. Ve všech případech je ale AI zatím jen podpůrným nástrojem pro lidské experty, ne jejich náhradou.

Plně automatizované kanceláře jsou zatím sci-fi

Studie z Carnegie Mellon jasně ukazuje, že i ty nejmodernější AI modely mají k plné autonomii daleko. Chybí jim selský rozum, improvizace i schopnost chápat kontext a mezilidskou komunikaci. AI zatím zůstává cenným pomocníkem, ale lidé jsou v komplexních úlohách stále nenahraditelní. Masivní nahrazování zaměstnanců technologiemi je tak v dohledné době nepravděpodobné. Pokus s virtuální firmou tak skončil fiaskem. A ukázal, že „selský rozum“ a schopnost improvizace zůstávají doménou lidí.

Zdroj: forbes.cz

Chceš dostávat další tipy o AI?

Přihlas se k odběru a zhruba 2x měsíčně ti pošlu to nejlepší ze světa AI.

Name(Required)
Privacy(Required)

Další články

Stačí 250 zmanipulovaných dokumentů a velký jazykový model se stane zranitelným

Představte si, že by někdo mohl sabotovat chatbota jen pomocí několika set zmanipulovaných textů. Společnost Anthropic ve spolupráci s britskými bezpečnostními instituty zjistila, že k zavedení zadních vrátek do velkého jazykového modelu stačí pouhých 250 škodlivých dokumentů. Velikost modelu ani objem trénovacích dat na tom nic nemění. Co to znamená pro bezpečnost AI?

Celý článek >

Jak firmy využívají AI agenty a proč má ChatGPT v Evropě takovou převahu?

Umělá inteligence vstoupila do firem ve formě AI agentů, kteří fungují jako digitální kolegové schopní samostatně řešit úkoly. Zároveň se rozhořela bitva o evropský trh, kde ChatGPT ovládá téměř 85 procent. Francouzský Le Chat chce být evropskou alternativou, ale cesta k úspěchu není jednoduchá. Co musí firmy udělat, aby z AI agentů vytěžily maximum? A komu nakonec budou evropské organizace důvěřovat?

Celý článek >

Suno Studio nabízí profesionální hudební tvorbu s pomocí umělé inteligence

Společnost Suno představila revoluční platformu Suno Studio, kterou označuje za první generativní audio pracovní stanici na světě. Tento nástroj spojuje tradiční možnosti hudebních editorů jako GarageBand s pokročilým AI generováním hudby. Stačí hrubý nápad, broukat melodii nebo zadat textový popis a umělá inteligence vytvoří kompletní skladbu. Platforma je dostupná pro prémiové předplatitele za 30 dolarů měsíčně.

Celý článek >