Una Red Neuronal Convolucional (Convolutional Neural Network) es un tipo especial de red neuronal diseñada para procesar datos con estructura de matriz, como imágenes.

Su idea central es aprovechar la correlación espacial entre píxeles cercanos para extraer características locales mediante filtros o kernels.

Tutoriales en colab

https://colab.research.google.com/drive/1eYhwvmDyAts8BxlC_BDqLg-amxrxEPIy?usp=sharing

https://colab.research.google.com/drive/1UH2Hy2t60f4VI3JTjupvjZWr56rCV9gZ?usp=sharing

Componentes principales:

  1. Capa convolucional: aplica filtros sobre la imagen para extraer características locales (bordes, texturas, formas).
  2. Capa de activación (ReLU, tanh, etc.): introduce no linealidad.
  3. Capa de pooling: reduce la resolución espacial (submuestreo).
  4. Capa totalmente conectada (Fully Connected): combina las características aprendidas para la clasificación final.
  5. Softmax / Sigmoid: genera probabilidades de salida.

Ejemplos de capas

imagen.png


La primera CNN: LeNet-5 (1989–1998)

LeCun et al., "Gradient-Based Learning Applied to Document Recognition", Proceedings of the IEEE, 1998.

Yann LeCun, Léon Bottou, Yoshua Bengio, y Patrick Haffner

Aplicación: Reconocimiento de dígitos manuscritos (MNIST).

Número aproximado de parámetros: ~60,000