Análisis de componentes principales
Estadística. Coeficiente de correlación. Variables. Matriz de datos. Diagonalización. Teorema de Pitágoras. Nube de puntos. Reperesentación plana

- Análisis de componentes principales
Ficha resumen del documento - Análisis de componentes principales
Versión PDF - Análisis de componentes principales
Versión para descargar
UNIVERSIDAD CATOLICA DE LA SANTÍSIMA CONCEPCIÓN
Facultad de Ingeniería
ANÁLISIS DE COMPONENTES
PRINCIPALES
(ACP)
I. Objetivos del Análisis de Componentes Principales
I.1. La Tabla de Datos
El ACP permite analizar la información de una tabla de tipo «individuos x variables cuantitativas».
Tabla de Datos

2. Objetivos del ACP
-
Evaluar la semejanza entre los individuos a través de los atributos considerados :
¿Existen grupos de individuos semejantes...?
¿Se observa una tipología de individuos...?
-
Evaluar la relación existente entre las características consideradas :
¿Existen grupos de variables correlacionadas entre ellas...?
¿Se observa una tipología de variables...?
Comparación de los individuos y relación entre las variables de la tabla en el ACP
II.1. Semejanza entre los individuos de la Tabla de Datos
-
La comparación de dos individuos i y j es evaluada con la distancia euclidiana clásica entre i y j :

-
Como las variables son consideradas con la misma importancia en la comparación, se les atribuye el mismo peso, mk = 1,

II. 2. Relación entre las variables de la Tabla de Datos
-
En el ACP, la relación entre las variables k y p es evaluada con el coeficiente de correlación (excepcionalmente : la covarianza) :

-
Como a los individuos se les atribuye, normalmente, la misma importancia (el mismo peso, mi = 1/n)...

III. Transformación de la Matriz de Datos
Matriz de Datos : X

Matriz de Datos Centrada-Reducida : Z

-
Efectos de esa transformación de la Matriz de Datos
-
Centrando la Matriz de Datos...
-
no se modifica la evaluación de la distancia entre dos individuos cualesquiera de la tabla.
-
no se modifica la evaluación de la correlación entre dos variables cualesquiera de la tabla.
-
La reducción de la Matriz de Datos...
-
no modifica la evaluación de la relación entre dos variables cualesquiera de la tabla.
-
hace que la evaluación de la semejanza entre dos individuos cualesquiera de la tabla sea independiente de las escalas de medida de las variables.
IV . La nube de puntos-individuos en R3 y en Rk
-
La base (e1,e2,e3) es una base ortonormal, centrada en G.

![]()
-
A la variable le corresponde el eje engendrado por e1 = (1,0,0), y así siguiendo...
-
En R3 el individuo i queda representado por :
-
El punto i , de coordenadas :


-
El extremo del vector wi , combinación lineal de los vectores de la base ortonormal,

1. Origen del espacio
-
El origen del espacio representa el «individuo medio».
-
El punto 0, en el espacio original, es el extremo del «vector de medias» de todas las variables.
2. Inercia total de la nube de puntos-individuos
-
Considerando el individuo i en Rk
Dispersión de Inercia total de

-
Si representamos al individuo i por un punto en el espacio R3
-
Si representamos al individuo i como el extremo del vector wi

¿Como se define la matriz V...?
3. La matriz de inercia de la nube de puntos-individuos
-
D : métrica de los pesos en Rn
-
Z : matriz X centrada-reducida
-
V : matriz de inercia, es la matriz de correlaciones
4. Contribución a la inercia del individuo i








