OpenTechLab Jablonec nad Nisou · Science Micro Elementary School
Odhalte tajemství jazykových modelů jako ChatGPT. AI "nepřemýšlí" – jen počítá pravděpodobnost dalšího slova. Vyzkoušejte si sami, jak se text generuje token po tokenu.
Attention ukazuje, jak moc spolu slova "souvisí". Klikněte na slovo a uvidíte, na která ostatní slova se AI nejvíce "dívá".
Beam Search je jako šachista, který zvažuje několik tahů dopředu. Místo výběru jednoho slova AI udržuje několik "větví" a vybere nejlepší cestu.
Halucinace nastávají, když se AI zeptáte na něco mimo tréninková data. AI neřekne "nevím" – místo toho vymýšlí nesmysly!
Latentní prostor je "dimenze významu", kde AI ukládá slova jako body. Podobná slova (vlk, pes) jsou blízko sebe, nesouvisející (vlk, koláče) daleko.
Token je základní jednotka, kterou AI čte. Může to být celé slovo, část slova, nebo i jen písmeno. Počítač nevidí "Ahoj" – vidí číslo jako 15339. ChatGPT má slovník ~100 000 tokenů.
AI nevymýšlí odpovědi. Počítá: "Po slově 'V lese' přijde s 65% pravděpodobností 'rostou', s 25% 'žije'..." Pak losuje. Temperature určuje, jak moc riskuje méně pravděpodobné volby.
Temp 0 = Vždy nejpravděpodobnější (nudné, opakuje se)
Temp 1 = Losuje i divoké možnosti (kreativní, ale občas nesmysly)
ChatGPT obvykle používá ~0.7
AI zná jen to, co viděla v tréninku. Pokud v textu není slovo "smartphone", AI ho nikdy nepoužije. Kvalita tréninku = kvalita odpovědí.