Na školeních se mě lidé stále ptají, který model je nejlepší.
Tak jsem pro vás nachystal největší srovnání podle účelu, na co chcete umělou inteligenci použít.
Trinity Mini je specializovaný model „řídké směsi expertů“ s 26 miliardami parametrů, určený pro agentní pracovní postupy s vysokou mírou uvažování. Navzdory menšímu aktivnímu prostoru vyniká v komplexní orchestraci a využití nástrojů.
GPT OSS 20B je odlehčený sourozenec řady OSS. S parametry 21B (aktivních 3,6B) je navržen pro běh na spotřebním hardwaru (MacBooky, RTX 4090) a zároveň poskytuje silné možnosti uvažování.
Zhuštěný model, který kombinuje rychlost Qwen s uvažovacími vzorci DeepSeek R1. Je optimalizován tak, aby poskytoval „promyšlené“ odpovědi bez plných výpočetních nákladů uvažovacího modelu.
Grok Code Fast 1 je specializovaný model vyladěný speciálně pro vysokorychlostní generování a ladění kódu. Integruje se s IDE a poskytuje téměř okamžité dokončování kódu a opravy.
Phi 4 škáluje data „učebnicové kvality“ na větší velikost (přibližně 14B) a přímo konkuruje variantám Llama 8B a Mistral. Na svou velikost pozoruhodně vyniká v uvažování, matematice a kódování.
Devstral 2 je vývojový stupeň Codestralu, určený nejen pro psaní kódu, ale i pro úkoly „vývojářského agenta“. Vyniká v plánování architektury, ladění a používání nástrojů CLI.
GLM 4.5 Air je efektivní a uživatelsky přívětivější sourozenec řady 4.5. S přibližně 12 miliardami aktivních parametrů přináší pokročilou architekturu řady 4.5 do velikosti, která umožňuje běžet na jediné špičkové grafické kartě.
Gemini 2.5 Flash Lite je cenově nejvýhodnější model v řadě Gemini, navržený pro masivní propustnost. Zachovává si základní multimodální a nástrojové funkce Flashe, ale za výrazně nižší cenu.
Codex Mini přináší kódovací znalosti GPT 5.1 do balíčku citlivého na latenci. Je navržen pro úlohy typu „automatické dokončování“ a rychlé opravy syntaxe, kde je rychlost prvořadá.
Mistral Nemo (12B) je kolaborativní model vytvořený ve spolupráci s NVIDIA, navržený tak, aby se přesně vešel do paměti jedné standardní GPU (jako jsou RTX 4090/A100 slices) s prostorem pro dlouhý kontext.
Gemma 3 12B je model Google s otevřenými váhami navržený pro efektivitu a lokální nasazení. Využívá multimodální architekturu se směsí expertů pro zajištění vysokého výkonu v kompaktním provedení.
Qwen 3 14B je „edge“ varianta nové generace rodiny Qwen. Přináší inteligenci na úrovni 70B do modelu, který se vejde na standardní 16GB notebook, a vyniká v oblasti vícejazyčného chatu a sledování instrukcí.