Na školeních se mě lidé stále ptají, který model je nejlepší.
Tak jsem pro vás nachystal největší srovnání podle účelu, na co chcete umělou inteligenci použít.
Euryale 70B v2.2 je vysoce kvalitní model pro hraní rolí známý pro svou výjimečnou inteligenci a schopnost odolat propracovaným/složitým scénářům. Kombinuje surovou sílu Llama 3.1 70B se specializovaným kreativním laděním.
Magnum v4 72B je komunitní vylepšení (obvykle založené na Qwen nebo Llama), speciálně navržené pro kvalitu prózy, kreativitu a hraní rolí. Odstraňuje styl „AI slop“ a vytváří tak narativní text podobný lidskému.
(Poznámka: Často se odkazuje na Qwen 2.5 32B nebo základní Qwen 3 32B). Robustní, hustý parametrický model 32B, který slouží jako páteř pro mnoho lokálních aplikací umělé inteligence.
GLM 4 32B je solidní model střední velikosti od společnosti Zhipu AI, který nabízí silný dvojjazyčný (čínština/angličtina) výkon. Je to spolehlivý univerzální přístroj pro standardní obchodní úkoly a chatovací úlohy.
Model „Omni“ z roku 2024, GPT-4o, zůstává relevantní pro své nativní zvukové/hlasové schopnosti. Zpracovává zvuk, obraz a text v jednom modelu a nabízí hlasové interakce s nízkou latencí.
Grok 4 je hraniční model xAI, který klade důraz na „uvažování podle prvních principů“ a hledání pravdy v reálném čase. Integruje živá data z platformy X, aby poskytoval přesný přehled o aktuálním dění.
Grok 4.1 Fast je zrychlená verze architektury Grok 4, optimalizovaná pro konverzační odpovědi s nízkou latencí. Zachovává si funkce uzemnění v reálném čase, ale za rychlost vyměňuje určitou hloubku uvažování.
Claude 4.5 Haiku přináší do efektivní úrovně „Haiku“ inteligenci na hranici možností. Vyrovná se výkonu předchozích vlajkových modelů (jako je Sonnet 4) a zároveň si zachovává nízkou latenci a náklady očekávané od lehkého modelu.
GLM 4.5 je výkonná verze Zhipu AI pro otevřené váhy (červenec 2025). Jedná se o masivní model MoE s 355 miliardami parametrů (32 miliard aktivních) a je navržen tak, aby konkuroval GPT-4 Turbo v oblasti uvažování a agentních pracovních postupů.
Claude 4.1 Opus je postupnou aktualizací vlajkové lodi modelu Opus 4, která vylepšuje jeho agentní a logické funkce. Nabízí vyšší spolehlivost při refaktorování kódu a vícekrokových pracovních postupech.
Qwen 2.5 Coder 32B je všeobecně považován za nejlepší kódovací model s otevřenou váhou ve své velikostní třídě. V kódovací zdatnosti konkuruje GPT-4o a zároveň je dostatečně malý na to, aby běžel na spotřebitelském hardwaru nebo cenově dostupných cloudových GPU.
Codestral 2508 (srpen 2025) je specializovaný kódovací model od společnosti Mistral. Podporuje více než 80 programovacích jazyků a je optimalizován pro „vyplňování uprostřed“ a porozumění kódu na úrovni repozitáře.