Modelos PCA a partir de conjuntos de datos con información faltante. ¿Se afectan sus propiedades?
En este trabajo se aborda la problemática de la construcción de modelos PCA (Principal Component Analysis) a partir de conjuntos de datos con información faltante. Se trabaja sobre tres situaciones diferentes con relación a la matriz de datos originales. En cada situación se generaron pérdidas...
Guardado en:
| Autor principal: | |
|---|---|
| Otros Autores: | |
| Formato: | article artículo publishedVersion |
| Lenguaje: | Español Español |
| Publicado: |
Facultad de Ciencia Económicas y Estadísticaca - Universidad Nacional de Rosario
2013
|
| Materias: | |
| Acceso en línea: | http://hdl.handle.net/2133/2345 http://hdl.handle.net/2133/2345 |
| Aporte de: |
| Sumario: | En este trabajo se aborda la problemática de la construcción de modelos
PCA (Principal Component Analysis) a partir de conjuntos de datos con información
faltante. Se trabaja sobre tres situaciones diferentes con relación a la matriz de datos
originales. En cada situación se generaron pérdidas a través de mecanismos aleatorios
y no aleatorios, en diferentes porcentajes en una sola variable por vez, seleccionada
mediante dos criterios: la que más contribuye y menos contribuye en la formación
de la primera componente principal. A partir de cada conjunto de datos incompletos
se construye el modelo PCA utilizando: Casos Completos, Nonlinear Iterative Partial
Least Squares (NIPALS) y Expectation Maximization (EM). Se comparan los resultados
con los obtenidos a través del conjunto de datos originales. Se definen una serie
de medidas para estudiar cómo se afectan los resultados según la dimensión de la
matriz de datos, el porcentaje y el mecanismo de pérdida, con relación a: bondad del
ajuste, bondad de predicción, vectores cargas, ortonormalidad de la matriz de cargas
y ortogonalidad de la matriz de “scores”. |
|---|