Na školeních se mě lidé stále ptají, který model je nejlepší.
Tak jsem pro vás nachystal největší srovnání podle účelu, na co chcete umělou inteligenci použít.
Mercury je hyperefektivní model zaměřený na rychlost (podobný rodině Hermes), optimalizovaný pro plynulou konverzaci a sledování pokynů. Je lehký a navržený jako nejrychlejší volba pro standardní úkoly.
Inception je model zaměřený na výzkum, navržený pro rekurzivní uvažování a „snové“ kreativní zkoumání. Vyniká v generování abstraktních konceptů, surrealistických příběhů a zkoumání hypotetických scénářů.
Inflection 3 Productivity posouvá architekturu Pi směrem k práci. Zachovává konverzační tón a zároveň přidává funkce pro psaní e-mailů, plánování a syntézu dokumentů.
Inflection (Pi) je model navržený s primárním zaměřením na emoční inteligenci (EQ) a podpůrnou konverzaci. Jeho cílem je být spíše laskavým a empatickým společníkem než chladným nástrojem produktivity.
Jamba Large 1.7 je hybridní model SSM-Transformer (architektura Mamba), který nabízí nekonečné kontextové okno s konstantním škálováním v čase. Vyniká ve zpracování extrémně dlouhých dokumentů bez zpomalení.
Aktualizace modelu Cohere Command R ze srpna 2024 je model optimalizovaný pro RAG (Retrieval Augmented Generation) a použití nástrojů. Vyniká v syntéze informací z externích dokumentů do přesných a citovaných odpovědí.
Noromaid 20B je model na míru (pravděpodobně sloučený model) navržený tak, aby nabízel kreativní psaní „třídy 70B“ v balení, které se vejde na 24GB VRAM karty. Je známý svou kvalitou prózy a schopností zvládat jemné narativní instrukce.
Morph V3 Large je specializovaný „aplikační“ model navržený tak, aby fungoval na konci kódovacího pracovního postupu. Neplánuje kód; aplikuje změny navržené jinými modely na rozsáhlé kódové základny neuvěřitelnou rychlostí (4 500 tokenů/s) s 98% přesností.
MythoMax 13B je legendární model sloučený s komunitou (založený na Llama 2), který je i nadále oblíbeným prvkem pro hraní rolí díky své specifické kvantizaci/ladění „Nitro“. Upřednostňuje kreativní a nefiltrované vyprávění před faktickou přesností.
Ministral 3 8B je vysoce efektivní přenosná verze řady Ministral. Je optimalizována pro rychlá prostředí s nízkými nároky na paměť a zároveň si zachovává funkce vidění.
Rnj 1 Instruct je překvapivě výkonný model s hustotou 8B, který daleko překonává svou váhovou kategorii. Je speciálně optimalizován pro kódování, STEM a agentní pracovní postupy a v těchto oblastech často překonává modely s hustotou 30B+.
Llama 3.1 8B je vysoce efektivní malý model, který překonává svou hmotnost. Je standardem pro lokální nasazení a cenově dostupné jednoduché úkoly.