Análisis de componentes principales

Freddy Hernández

2019/02/01

Introducción

En esta publicación se mostrará al lector en qué es el análisis de componentes principales, los conceptos básicos detrás de la técnica y varios ejemplos ilustrativos.

Análisis de componentes principales

Es una herramienta para reducir el numero de variables originales por nuevas variables llamadas componentes y que son incorrelacionadas. Con esta herramienta es posible pasar de un problema de dimensión \(n \times p\), a un problema de dimensión \(n \times k\), siendo \(k < p\). En la siguiente figura se ilustra la idea central.

Ilustración de la reducción de dimensión

Ilustración de la reducción de dimensión

Objetivo

Supongamos que se tienen \(p\) variables \([X_{1}, X_{2}, \dots, X_{p}] = \boldsymbol{X}^\top\) con vector de medias \(\boldsymbol{\mu}\) matriz de varianzas y covarianzas \(\boldsymbol{\Sigma}\). Lo que queremos es crear \(p\) combinaciones lineales a partir de las variables originales.