🧠 Badatelský deník inženýra AI

Laboratoř neuronových sítí | Autoencoder - Komprese a rekonstrukce
1

Co je Autoencoder?

~ 30 min

1. Architektura Autoencoderu

Autoencoder je neuronová síť, která se učí komprimovat data a pak je rekonstruovat.

Skládá se ze dvou částí: Encoder (komprese) a Decoder (dekomprese).
📥
Encoder
Komprese
💜
Latent Space
2D bod
📤
Decoder
Rekonstrukce

2. Analogie z reálného světa

Autoencoder je jako telefonní linka s omezenou kapacitou:

Prvek Telefon Autoencoder
Vstup Hlas mluvčího
Komprese Mikrofon převede na signál
Přenos Úzká linka (omezená kapacita)
Dekomprese Reproduktor převede zpět

3. Komprese dat

100
Vstup (10×10)
2
Latent (X, Y)
100
Výstup (10×10)

Vypočítej kompresní poměr:

Vstup: 10 × 10 = hodnot
Latent: hodnoty

Kompresní poměr: 100 ÷ 2 = × komprese!

Proč je to užitečné?

2

Latentní prostor - "Mapa všech obrázků"

~ 45 min

1. 8 prototypů v simulátoru

Simulátor obsahuje 8 základních vzorů rozmístěných v kruhu:

❤️
Srdce
😊
Smajlík
👾
Vetřelec
Kříž
Čtverec
Kruh
🏠
Domek
💎
Diamant

2. Co je latentní prostor?

Latentní prostor = "Mapa všech možných obrázků"

Každý bod [X, Y] v tomto 2D prostoru odpovídá nějakému obrázku. Podobné obrázky jsou blízko sebe, odlišné daleko.

3. Experiment: Prozkoumej latentní prostor

Použij slidery X a Y nebo klikej do latentního prostoru a pozoruj výstup:

Pozice [X, Y] Co vidíš na výstupu? Nejbližší prototyp
[0, -1] (nahoře)
[1, 0] (vpravo)
[0, 1] (dole)
[0, 0] (střed)

4. Interpolace mezi vzory

Co se stane, když přesuneš bod mezi dva prototypy?

Od → Do Popis přechodu
Srdce → Čtverec
Smajlík → Kříž
Kruh → Diamant

5. Nakresli mapu latentního prostoru

Nakresli kruh s 8 prototypy a ukázku, kde by mohl ležet "mix srdce a čtverce":

3

Encoder - Komprese vstupu

~ 35 min

1. Jak funguje Encoder?

Encoder: Obrázek (100 hodnot) → 2 čísla [X, Y]

Encoder se naučil, které vzory jsou si podobné.
Podobné obrázky mapuje na blízké body v latentním prostoru.

2. Experiment: Nakresli a zkomprimuj

Nakresli různé vzory a zmáčkni "Zkomprimovat". Zaznamenej výsledky:

Co jsi nakreslil/a Výsledný bod [X, Y] Rozpoznaný prototyp F1 Score (%)
Přesné srdce
Nepřesné srdce
Čtverec
Náhodná čmáranice

3. F1 Score metrika

F1 Score měří přesnost rozpoznání:

F1 = 2×TP / (2×TP + FP + FN)

TP = True Positive (pixel svítí v obou)
FP = False Positive (svítí jen u tebe)
FN = False Negative (svítí jen u prototypu)

Proč je F1 lepší než prosté sčítání shod?

4

Decoder - Rekonstrukce z bodu

~ 35 min

1. Jak funguje Decoder?

Decoder: 2 čísla [X, Y] → Obrázek (100 hodnot)

Decoder počítá "váženou kombinaci" nejbližších prototypů.
Čím blíže je bod k prototypu, tím více ho ovlivňuje.

2. Experiment: Reconstruction Loss

Nakresli vzor, zkomprimuj, a sleduj "Reconstruction Loss":

Vstup Reconstruction Loss Komentář
Přesný prototyp
Podobný, ale ne přesný
Úplně nový tvar

3. Error Highlighting

Zapni "Error Highlighting" v nastavení. Červeně blikající pixely = největší chyba.

Kde jsou chyby největší?

4. Parametr Interpolace

Změň hodnotu "Interpolace" slideru a pozoruj efekt na přechody:

Exp hodnota Efekt na přechody
1.0 (nízká)
2.5 (střední)
5.0 (vysoká)
5

Denoising - Čištění šumu

~ 30 min

1. Autoencoder jako čistič

Denoising Autoencoder:

Když přidáš šum k obrázku a pak ho "proženeš" autoencodereem, síť ho automaticky opraví! Jak je to možné?

2. Experiment: Přidej šum

Načti prototyp, zmáčkni "Add Noise", pak "Zkomprimovat":

Originální vzor Loss po přidání šumu Loss po rekonstrukci Opravil se?
Srdce
Smajlík
Čtverec

3. Proč to funguje? Manifold Hypothesis

🎓 Hypotéza Variet (Manifold Hypothesis):

Všechny "smysluplné" obrázky leží na nízko-dimenzionální ploše (varietě) uvnitř vysoce-dimenzionálního prostoru. Šum posune data MIMO tuto varietu. Autoencoder pak data "spadne" zpět na varietu = opraví šum!

Nakresli schéma: 2D varieta v 3D prostoru, bod s šumem mimo ni, a jeho projekce zpět:

Vysvětli vlastními slovy, proč šum "zmizí":

6

Kreativní průzkum

~ 30 min

1. Tour mód

Zmáčkni "Tour" a sleduj animovanou cestu kolem všech prototypů:

Co pozoruješ při přechodech mezi vzory?

2. Record & Play

Zmáčkni "Record", nakresli cestu myší v latentním prostoru, pak "Play":

Jakou cestu jsi nakreslil/a?
Nejzajímavější moment během přehrávání:

3. Explore - Náhodné body

Zmáčkni několikrát "Explore" a sleduj náhodné vzory:

Které náhodné vzory vypadaly nejzajímavěji?

4. Heatmap

Zapni "Heatmap" v nastavení. Co ukazují barvy?

7

Klíčové závěry a reflexe

~ 20 min

1. Co jsme se naučili

Koncept Tvé shrnutí
Autoencoder
Encoder
Latentní prostor
Decoder
Denoising

2. Praktické využití Autoencoderů

Reálné aplikace:

🖼️ Komprese obrázků: JPEG 2000 používá podobné principy
🔊 Komprese zvuku: MP3 a další formáty
🧹 Čištění šumu: Restaurování starých fotografií
🔍 Detekce anomálií: Vysoký Loss = neznámý vzor
🎨 Generování: Základ pro VAE a generativní modely

3. Od Autoencoderu k pokročilým modelům

Autoencoder → VAE → GAN → Diffusion Models

Autoencoder je základem pro mnoho pokročilých generativních modelů. VAE (Variational Autoencoder) přidává náhodnost pro lepší generování. Tyto principy vedou až k moderním modelům jako Stable Diffusion!

4. Závěrečná reflexe

Jaký byl tvůj největší "aha moment"?

Co tě překvapilo na latentním prostoru?

Jak bys vysvětlil/a denoising kamarádovi?

5. Sebehodnocení

Jak dobře rozumím Autoencoderům? (1 = vůbec, 5 = úplně)