Introducción
En esta publicación se mostrará al lector en qué es el análisis de componentes principales, los conceptos básicos detrás de la técnica y varios ejemplos ilustrativos.
Análisis de componentes principales
Es una herramienta para reducir el numero de variables originales por nuevas variables llamadas componentes y que son incorrelacionadas. Con esta herramienta es posible pasar de un problema de dimensión \(n \times p\), a un problema de dimensión \(n \times k\), siendo \(k < p\). En la siguiente figura se ilustra la idea central.
Ilustración de la reducción de dimensión
Objetivo
Supongamos que se tienen \(p\) variables \([X_{1}, X_{2}, \dots, X_{p}] = \boldsymbol{X}^\top\) con vector de medias \(\boldsymbol{\mu}\) matriz de varianzas y covarianzas \(\boldsymbol{\Sigma}\). Lo que queremos es crear \(p\) combinaciones lineales a partir de las variables originales.