OpenTechLab Jablonec nad Nisou · Science Micro Elementary School
Pochopte, jak počítače "vidí". Aplikujte konvoluční filtry, sledujte matematiku za každým pixelem a extrahujte rysy z obrazu.
Výstup = Σ (Pixel × Váha)
Podívej se na výstup a uhádni, který filtr byl použit:
Matice 3×3 (kernel) se posouvá přes obrázek. V každé pozici vynásobí hodnoty pixelů vahami kernelu, sečte je a vytvoří jeden výstupní pixel. Takto se extrahují rysy jako hrany.
Stride (Krok) = kolik pixelů kernel přeskočí při každém kroku. Stride 2 = výstup je
poloviční.
Padding (Okraj) = přidání nul kolem obrázku pro zachování velikosti.
Skutečné CNN mají mnoho vrstev. Vrstva 1 hledá hrany, Vrstva 2 je kombinuje do rohů a textur, hlubší vrstvy rozpoznávají objekty. Zkuste zapnout 2 Vrstvy!
Zmenšuje obrázek výběrem maximální hodnoty z každého bloku 2×2. Poskytuje odolnost vůči posunu a snižuje výpočetní náročnost.