Claude Opus 4.6: Evoluce “Génia” v praxi
V komunitě kolem umělé inteligence se pro model Opus vžilo označení „Génius“. Zatímco modely Haiku jsou sprinteři, kteří odbaví tisíce požadavků za sekundu, a Sonnet je univerzální pracant do každého počasí, Opus byl vždy ten, za kým jste šli s neřešitelným problémem. Byl to ten „kolega“, který sice neodpoví hned, ale když už něco řekne, má to váhu. S příchodem verze 4.6 se tato jeho role nejen potvrzuje, ale posouvá do roviny, kterou jsme si ještě před rokem neuměli představit.
Anthropic se tentokrát nezaměřil jen na hrubou výpočetní sílu nebo rychlost reakce. Místo toho se soustředili na vytrvalost, schopnost dlouhodobého plánování a hloubku porozumění. Vytvořili model, který má ambici nejen text generovat, ale skutečně nad ním přemýšlet v širších souvislostech.
Paměť, která dohání Gemini
Největší novinkou, která rezonuje napříč celým technologickým oborem, je rozšíření kontextového okna na 1 milion tokenů (prozatím v beta verzi pro předplatitele). Abychom si to převedli do lidské řeči – 1 milion tokenů odpovídá zhruba 750 000 slovům. To není jedna kniha. To je celá malá knihovna.
Zatímco dříve se modely při čtení velmi dlouhých dokumentů ke konci “ztrácely” a zapomínaly detaily ze začátku (tzv. lost in the middle phenomenon), verze 4.6 udrží v aktivní paměti obsah odpovídající:
- Kompletní historii projektové dokumentace za několik let.
- Všem firemním směrnicím, manuálům a právním smlouvám najednou.
- Celým repozitářům kódu středně velké aplikace.
V testech typu “needle-in-a-haystack” (hledání jehly v kupce sena), kdy musí AI najít jednu konkrétní, zapadlou informaci v záplavě textu, dosahuje Opus 4.6 úspěšnosti 99,6 % tam, kde i skvělý Sonnet 4.5 začínal chybovat a halucinovat. Pro firmy to znamená konec složitého kouskování dat. Můžete mu “nasypat” vše najednou a on bude souvislosti hledat v celku, nikoliv v izolovaných fragmentech.
Srovnání: Opus 4.5 vs. Opus 4.6
Mnozí z vás pravděpodobně stále využívají verzi 4.5 a ptají se, zda má smysl řešit přechod. Není to jen marketing? Rozdíl mezi těmito verzemi je však fundamentální, zejména v přístupu k řešení problémů:
- Samostatnost a “Computer Use 2.0”
Verze 4.5 byla chytrá, ale při ovládání počítače (funkce, kdy AI sama hýbe myší a píše do aplikací) působila jako stážista, kterého musíte kontrolovat. Často se zasekla na vyskakovacím okně nebo špatně klikla. Nová 4.6 byla trénována specificky na to, aby “viděla” obrazovku jako člověk. Dokáže nejen navrhnout postup, ale reálně ho v počítači vykonat s mnohem menší chybovostí. Zvládne otevřít Excel, vyfiltrovat data, zkopírovat je do e-mailu a odeslat – to vše autonomně. - Hluboká logika a uvažování
V benchmarku GPQA (Graduate-Level Google-Proof Q&A), který testuje schopnosti v expertních oblastech jako biologie, fyzika či právo, překonává novinka svého předchůdce o výrazných 12 %. V praxi to znamená, že Opus 4.6 méně “hádá” a více “odvozuje”. Pokud si není jistý, má tendenci se doptat nebo uvést míru nejistoty, místo aby si vymyslel přesvědčivou lež. - Koncept “Agent Teams”
Toto je absolutní novinka. Zatímco Opus 4.5 pracoval jako jeden osamocený expert, verze 4.6 zavádí koncept “týmů agentů”. Když zadáte složitý úkol, model si ho interně rozdělí:- Manager Agent: Rozplánuje strategii.
- Worker Agents: Provedou dílčí úkoly (jeden píše kód, druhý píše dokumentaci).
- Critic Agent: Zkontroluje výstup a vrátí ho k přepracování, pokud není perfektní. Tím se eliminuje tunelové vidění. AI si sama sobě dělá oponenturu ještě předtím, než vám ukáže výsledek.
Osobní experiment: Měsíc na tarifu “Max”
Když vidím ty specifikace, nemohu zůstat jen u teoretizování. Často svým klientům radím, že pro běžnou administrativu stačí tarif Pro. Ale pokud je Opus 4.6 skutečně takový “Génius”, chci vidět jeho absolutní strop. Proto jsem se rozhodl ke kroku, který běžně nedělám – na následující měsíc přecházím na tarif “Max” (cena začíná na 100 USD měsíčně), který je určen pro “power users”.
Můj cíl je jednoduchý: chci ho „uštvat“. Chci zjistit, zda je ten příplatek jen pro velké korporace, nebo zda může i menší firmě ušetřit desítky hodin práce měsíčně takovým způsobem, že se investice okamžitě vrátí.
Pro koho je nový Opus určen?
Je důležité říct, že Claude Opus 4.6 není nástroj pro každého. Pokud potřebujete vygenerovat e-mail na rozloučenou nebo shrnout jeden článek, je to jako jít s kanónem na vrabce – zbytečně drahé a pomalé (Opus je stále pomalejší než modely Sonnet).
Tento model je pro:
- Vývojáře a Softwarové architekty: Kteří potřebují řešit komplexní logiku napříč stovkami souborů.
- Právníky a Analytiky: Kteří pracují se stohy dokumentů, kde každé slovíčko hraje roli.
- Manažery a Stratégy: Kteří potřebují “druhý mozek” pro oponenturu svých rozhodnutí.
Závěr: Evoluce, ne revoluce (ale podstatná)
Claude Opus 4.6 možná na první pohled nemění svět bombastickými funkcemi generování videa nebo hudby. Dělá ale něco důležitějšího – stává se spolehlivějším parťákem pro těžkou kognitivní práci. Pokud pracujete hlavou a vaše práce spočívá ve spojování souvislostí, tohle je nástroj, který by neměl uniknout vaší pozornosti.
Já jdu do toho. Dávám všanc své peníze i čas, abych otestoval, zda se blížíme době, kdy budeme mít v počítači skutečného kolegu, ne jen chytrou kalkulačku. O výsledcích mého “měsíce s Maximem” vás budu brzy informovat.
Zdroje:
Anthropic, TechCrunch, VentureBeat