OpenTechLab Jablonec nad Nisou · Science Micro Elementary School
Nakresli vzor vlevo → Síť ho zkomprimuje do 2D bodu → Vpravo uvidíš rekonstrukci.
Vylepšení: heatmap, error highlighting, path recording, tour mode!
Neuronová síť, která se učí komprimovat data do menší reprezentace (latent space) a pak je zase rekonstruovat. Učí se automaticky najít důležité vzory.
Vstup → Encoder → Latent (2D) → Decoder → Výstup
Zlepšené rozpoznávání vzorů pomocí F1-Score:
F1 = 2×TP / (2×TP + FP + FN)
Počítá nejen shody (TP), ale i chyby (FP = false positive, FN = false negative). To zajišťuje přesné rozpoznání smajlíka i ostatních vzorů!
2D reprezentace, kde každý bod odpovídá nějakému obrazu. 8 prototypů je rozmístěno v kruhu. Pohybem mezi nimi vznikají plynulé přechody.
Heatmap: Barevná mapa ukazuje, jak by vypadal výstup v každém bodě prostoru.
Explore: Náhodný bod v prostoru
Tour: Animovaná cesta kolem všech vzorů
Record/Play: Nahraj si svoji cestu a přehraj ji
Error Highlighting: Červeně blikající pixely = největší chyba
Náš autoencoder komprimuje 100 vstupních hodnot (10×10 mřížka) do 2 čísel v latentním prostoru (bottleneck), ze kterých pak rekonstruuje původních 100 hodnot. Tato 2D reprezentace umožňuje vizualizaci a interaktivní prozkoumání latentního prostoru.
Důležité: Bottleneck s pouze 2 neurony vytváří informační úzké hrdlo, které nutí síť naučit se kompaktní reprezentaci dat. Právě tyto 2 hodnoty pak můžeme zobrazit jako bod v 2D prostoru a interaktivně s ním pracovat v simulátoru výše.
Proč dokáže Autoencoder opravit zašuměný obrázek? Odpověď nabízí matematická Hypotéza Variet. Tvrdí, že reálná data (smysluplné obrazy) nejsou v prostoru náhodně rozeseta, ale leží na nízko-dimenzionální zakřivené ploše (varietě) uvnitř vysoce-dimenzionálního prostoru.
V našem případě má vstupní prostor 100 dimenzí (10x10 pixelů). Většina bodů v tomto prostoru je jen náhodný šum. Smysluplné tvary (srdce, čtverec...) tvoří pouze tenkou 2D varietu (náš Latent Space).
Aplikace v simulátoru: Když použijete tlačítko Add Noise, posunete bod mimo
tuto varietu (do prostoru šumu).
Encoder se však naučil mapovat pouze na varietu. Proto když tento bod promítne zpět, "spadne" zpátky na
povrch variety – tím se šum odstraní a zůstane jen čistý tvar.