Nová éra autonomních AI agentů: Claude Opus 4 a Sonnet 4
Claude Opus 4: Sedm hodin samostatné práce bez přestávky
Anthropic na své první konferenci Code with Claude představil model Claude Opus 4, který označuje za nejlepší kódovací AI na světě. Tento model dokáže samostatně řešit složité úkoly, které vyžadují tisíce jednotlivých kroků, a to bez nutnosti lidského dohledu. V testech u zákazníků zvládl Opus 4 pracovat na jednom úkolu až sedm hodin v kuse, což odpovídá téměř celému pracovnímu dni. To je zásadní posun pro tzv. agentní systémy – AI, které plánují a vykonávají komplexní úkoly zcela autonomně.
Opus 4 vyniká nejen v délce souvislé práce, ale také v přesnosti a spolehlivosti. Podle Anthropic je o 65 % méně náchylný k využívání zkratek nebo „obejití“ zadání oproti předchozím modelům, což zvyšuje důvěryhodnost výsledků při dlouhodobých a komplexních úkolech.
Vylepšené paměťové schopnosti a práce s nástroji
Jedním z klíčových vylepšení je schopnost modelu pracovat s pamětí a nástroji. Pokud vývojář umožní Claudu přístup k lokálním souborům, dokáže model uchovávat a využívat důležité informace během celého procesu – například si vytváří „memory files“ pro lepší orientaci v rozsáhlých projektech. Opus 4 i Sonnet 4 navíc zvládají používat více softwarových nástrojů současně, což umožňuje paralelní řešení různých částí úkolu a efektivnější práci.
Oba modely podporují tzv. „extended thinking“ – tedy střídání mezi rychlými odpověďmi a hlubším promýšlením, včetně využití webového vyhledávání a dalších externích nástrojů. To znamená, že AI může nejen rychle reagovat, ale také se zaměřit na složitější problémy, které vyžadují delší analýzu.
Claude Sonnet 4: Výkon pro každodenní použití
Vedle Opus 4 představuje Sonnet 4 rychlejší a efektivnější variantu, která je vhodná pro běžné firemní i individuální využití. Sonnet 4 navazuje na úspěšný model Sonnet 3.7, ale přináší vyšší přesnost v kódování, lepší schopnost následovat instrukce a vylepšené řešení složitých úloh. Výhodou je, že Sonnet 4 je dostupný i pro neplatící uživatele a jeho API zůstává cenově dostupné.
Podle zpětné vazby od firem jako GitHub, Cursor nebo Replit přináší Sonnet 4 i Opus 4 výrazné zlepšení v oblasti navigace v rozsáhlých kódech, automatizace rutinních úkolů a snižování chybovosti při dlouhodobých projektech.
Bezpečnost, transparentnost a praktické využití
Anthropic klade důraz na bezpečnost a transparentnost svých modelů. Snížení tzv. „reward hacking“ – tedy situací, kdy AI obchází zadání, aby dosáhla kýženého výsledku, je klíčové pro důvěru firemních uživatelů. Firma také zavádí nové možnosti sumarizace myšlenkových procesů AI, což usnadňuje kontrolu nad tím, jak model k výsledku dospěl.
Modely Claude 4 jsou dostupné prostřednictvím API, na platformách jako Amazon Bedrock, Google Vertex AI a nově i jako výchozí model pro kódovacího agenta v GitHub Copilot. To výrazně rozšiřuje možnosti jejich využití v podnikovém prostředí – od automatizace vývoje až po komplexní analýzu dat.
Zdroje: Engadget | Mashable | Anthropic | CNBC | Ground News | Ars Technica