miércoles, 7 de mayo de 2008

Análisis de componentes principales aplicado a datos de préstamos bancarios. Alternativa a la obtención del modelo econométrico.

5.- CONCLUSIONES
- Las formulas de representatividad de información obtenida por un análisis de componente principal es por definición un modelo econométrico, al permitirnos obtener un modelo matemático final a través del cual se puede hacer el cálculo de la entropía (intensidad de información) de cada atributo o variable.
Observando la tabla anterior y centrandonos en la matriz de correlación tenemos que para cada una de las variables se ha obtenido un proceso de clasificación sobre la cual el segundo componente principal es el que debe ser tomado en cuenta para procesos de clasificación siguientes, puesto que acumula el 99% de la información, en cuyo caso este es el modelo econométrico que debe ser tomado en cuenta para el analisis de los datos por lo que concluyo también que es la variable dos la UDIS un elemento indispensable a la hora de otorgar un préstamo bancario. En otras palabras se aclara la hipotesis de decir que el riesgo es directamente atado al tiempo en este caso.
- Los componentes principales no solamente se aplican a datos económicos pueden ser usados en problemas en donde la cantidad de variables es superior como en el caso de: las imágenes de satélite, ver en [1], grandes bases de datos e inclusive en donde la información sostiene ruido. En este ejercicio la reducción de variables de 8 hasta 6 ha sido demostrado, además sea verificado que la relación de Y para la inclusión de nuevos componentes puede ser realizada mediante un nuevo análisis de correlación con los nuevos componentes Z calculado. Ahora bien, en este sentido nos permite observar la inclusión de nuevas variables al modelo, como si quisiéramos saber si lo que estamos preguntando influye o no en los resultados, el instante de otorgar un préstamo bancario.
- Los componentes principales escogen un atributo o atributos que tienen mayor representatividad sobre otros. En la experimentación observamos que la obtención de valores se da en base a si se puede otorgar un préstamo bancario o no. Observemos entonces que tenemos un conjunto de variables y luego obtenemos un modelo que es dependiente en este caso del que es capas de sostener mayor entropía o sea mayor cantidad de información como es el tiempo en meses.
- Los componentes principales determinan un nuevo conjunto de variables que permiten representar adecuadamente la información, que en definitiva es el nuevo modelo econométrico propuesto para el análisis de los datos. Cabe destacar en esta conclusión que el modelo es fácilmente comprobable y reducible para nuestros datos (ver tabla 1). De un conjunto de variables en nuestro problema que es de 20 sin la clase pasamos a obtener un nuevo modelo en base a los filtros y el análisis de componentes principales que es de 8. Para este caso podemos ubicar la revisión de los filtros de redundancia de datos, pero sin perder la entropía.
- Los componentes principales es un método de entrenamiento basado en instancias, por lo tanto no puede ejecutar una validación del modelo econométrico obtenido ya sea con los datos que existen o con nuevas instancias que ingresen. Lo que quiere decir que para cada conjunto de datos o para cada banco se obtendrá una solución propietaria.
- Se comprueba el modelo construido en Weka a través del procedimiento matemático en Matlab, el cual nos permitió explicar el procedimiento matemático de los componentes principales, en este sentido los dos primeros componentes explican toda la relación de las variables ya que para weka el segundo componente ya observa el 90% de la información y para matlab Z1 = Z2 como se pudo comprobar. Los componentes K2 fueron un análisis que nos permitió incrementar mas variables si fuera el caso, como ocurrió en este estudio.

No hay comentarios: