Jak jsem vytvořil největší AI slovník za pouhých 8 hodin

Jak se vyznat v dnešním světě, kde umělá inteligence (AI) postupuje mílovými kroky vpřed? Zároveň jsem dostal zpětnou vazbu i od účastníků svých kurzů, že je kolem AI tolik nových výrazů a názvů, že se někdy ztrácejí. A tak jsem chtěl pro ně najít zdroj, kde by vždy našli odpověď, která by pro ně byla srozumitelná, ať už jsou začátečníci nebo pokročilejší. Jenže když jsem začal pátrat, tak jsem nenašel žádný, s kterým bych byl spokojený. Jeden byl příliš odborný, druhý zas neobsahoval dost výrazů. A tak jsem se rozhodl vzít věci do vlastních rukou a vytvořit nejobsáhlejší slovník pojmů na internetu.
ai-slovnik-mistr-ai-robot-studuje-slovnik-na-zachode (1)

Jak jsem postupoval aneb od nápadu k realizaci 

Generování termínů o umělé inteligenci

S ohledem na etiku jsem nechtěl vykrádat cizí slovníky a dělat z nich nějaký kompilát, tak jsem začal doslova na zelené louce. Moje cesta proto začala generováním výrazů týkající se umělé inteligence. Jenže nechat si generovat 700 výrazů najednou, to by nedopadlo dobře. Chtěl jsem mít kontrolu nad výstupem, protože generativní AI přeci jen občas umí občas velmi dobře halucinovat. Zároveň jsem ji chtěl směrovat, tak jsem ji vždy požádal o 100 výrazů a postupoval v dávkách, dokud jsem se nedostal na úctyhodných 700 termínů souvisejících s umělou inteligencí

Čištění dat a strukturování 

Následovala méně zábavná, ale nezbytná část – čištění dat. Použil jsem další AI nástroje (konkrétně Perplexity a chatbota Claude) ke kritickému zhodnocení vygenerovaných výrazů. Musel jsem vyřadit termíny, které s AI nesouvisely, a odstranit duplicity. Upřímně, i když se o umělou inteligenci hodně zajímám, tak v seznamu byly některé výrazy, které jsem sám slyšel prvně. Proto jsem si pomohl právě AI nástroji, které toho sami o sobě ví přeci jen víc. Tím jsem se dostal na poměrné slušné množství dat kolem 480 výrazů a pojmů. 

Rozšíření slovníku pomocí pokročilých nástrojů

Pak přišla fáze srovnání. Porovnávat české a zahraniční slovníky ručně by bylo na palici, tak jsem udělal srovnání pomocí umělé inteligence. Nejlepší na vyhledávání je Perplexity, tak jsem ho nechal, ať mi vypíše “konkurenční” AI slovníky. Následně jsem je vykopíroval s nástrojem Hexomatic a nechal kriticky zhodnotit chatbot Claude oba soubory. Tím mi vypsal poslední výrazy, které mi v mém detailním seznamu chyběly. Tohle jsem udělal opakovaně pro různé srovnání, až jsem se dostal na celkovou hodnotu 500+ výrazů. Co je nejlepší, tak že neobsahuje jen základní výrazy spojené s generativní umělé inteligence, ale i různé často hledané názvy jako jsou názvy společností (např. OpenAI, Anthropic), názvy jednotlivýc hnástrojů (např. ChatGPT, Gemini, Adobe Firefly), názvy jednotlivých jazykových modelů (Flux, Sonnet, Grok, apod.) a dalších pojmů ze světa umělé inteligence, strojového učení a neuronových sítí. Vzniknul tak nejkomplexnější AI slovník, jaký je dostupný na českém i anglickém internetu.

Struktura AI slovníku: Tři úrovně porozumění

I když jsem měl detailní a očištěný dataset, tak skutečná práce teprve začínala. Následně bylo potřeba vytvořit strukturu, jak chci, aby byl každý výraz vysvětlen a zpracován. Vytvořil jsem proto třístupňovou strukturu pro každý výraz:

  1. Odborná definice pro profesionály v oblasti umělé inteligence
  2. Vysvětlení pro laiky zajímající se o AI
  3. Anglický překlad a definice pro mezinárodní kontext

Pro generování těchto výstupů jsem pracoval s českou AI aplikací Everbot, kde jsem zvolil jazykový model Claude 3.5 Sonnet. Co mě překvapilo, tak bylo limit na straně výstupu. Musel jsem proto vše dávkovat jen po 10 výrazech, jenže i tak mi při zhruba 5. opakování neudržel ve své kontextové paměti strukturu a musel jsem mu ji zadávat opakovaně. Nicméně po zhruba hodince intenzivní práce a zhruba 100 stran vygenerovaného obsahu čítajícího přes 100 000 slov jsem byl o krok blíže celého díla. 

Formátování a import dat AI slovníku

V tuto chvíli jsem si myslel, že mám vyhráno, ale pak mi došlo, že potřebuji celý výstup upravit do formátu tabulky k následnému importu pro webové stránky. Tak jsem se obrátil na mnohdy podceňovaný Copilot od Microsoftu a nechal si jednotlivé odstavce textů převést do tabulkového formátu pro hromadný import. Data jsem uložil ve formátu CSV, který je ideální pro snadný import do různých systémů. Tím jsem zajistil, že můj AI slovník pojmů bude snadno přístupný a použitelný na různých platformách.

Výsledek: Nejobsáhlejší slovník pojmů o umělé inteligenci na internetu

Po pouhých 8 hodinách intenzivní práce jsem dokázal vytvořit rozsáhlý AI slovník s více než 500 výrazy. Každý výraz obsahuje odborné vysvětlení, laickou definici a anglický překlad. Je to jako mít tři slovníky v jednom, pokrývající všechny aspekty umělé inteligence.

Tento slovník je komplexní a snadno použitelný pro různé úrovně znalostí. Odborníci ocení přesné technické definice, zatímco začátečníci nebo zájemci o AI využijí srozumitelná laická vysvětlení. Anglické překlady navíc umožňují snadnou orientaci v mezinárodní literatuře a diskusích. Slovník pokrývá širokou škálu témat souvisejících s umělou inteligencí, včetně strojového učení, neuronových sítí, zpracování přirozeného jazyka, počítačového vidění a mnoha dalších. Obsahuje jak základní pojmy, tak i pokročilé koncepty, což z něj dělá cenný zdroj pro studenty, výzkumníky i profesionály v oboru.

Díky tomuto slovníku mohou uživatelé rychle najít potřebné informace a lépe porozumět složitým konceptům AI. Zároveň může sloužit jako výchozí bod pro další studium nebo jako rychlá referenční příručka při práci na AI projektech. V budoucnu plánuji slovník pravidelně aktualizovat, aby odrážel nejnovější trendy a vývoj v oblasti umělé inteligence. Pokud máte zájem o AI a hledáte spolehlivý zdroj informací, určitě se podívejte na můj AI slovník. A nezapomeňte – v oblasti AI je vzdělávání celoživotní proces, tak proč nezačít právě teď s nejkomplexnějším AI slovníkem na internetu?

Chceš dostávat další tipy o AI?

Přihlas se k odběru a zhruba 2x měsíčně ti pošlu to nejlepší ze světa AI.

Name(Required)
Privacy(Required)

Další články