Trabajar con modelo
Monodeep Mukherjee
Seguir
--
Escuchar
Compartir
Author : Luca Scrucca, Mohammed Saqr, Sonsoles López-Pernas, Keefe Murphy
Resumen: La heterogeneidad ha sido un tema candente en la literatura educativa reciente. Se han hecho varios llamados para adoptar métodos que capturen diferentes patrones o subgrupos dentro del comportamiento o funcionamiento de los estudiantes. Suponer que existe un patrón promedio que representa a la totalidad de las poblaciones estudiantiles requiere que el constructo medido tenga el mismo mecanismo causal, el mismo patrón de desarrollo y afecte a los estudiantes exactamente de la misma manera. Utilizando un método centrado en la persona (modelo de mezcla gaussiana finita o análisis de perfil latente), el presente tutorial muestra cómo descubrir la heterogeneidad dentro de los datos de participación mediante la identificación de tres grupos latentes o no observados. Este capítulo ofrece una introducción a la agrupación basada en modelos que incluye los principios de los métodos, una guía para elegir el número de agrupaciones, la evaluación de los resultados de la agrupación y una guía detallada con código y un conjunto de datos de la vida real. La discusión profundiza en la interpretación de los resultados, las ventajas de la agrupación basada en modelos y cómo se compara con otros métodos.
2. Una revisión sobre la agrupación en clústeres basada en modelos bayesianos (arXiv)
Autor: Clara Grazian
Resumen : La agrupación es una tarea importante en muchas áreas del conocimiento: medicina y epidemiología, genómica, ciencias ambientales, economía, ciencias visuales, entre otras. A menudo se ha demostrado que las metodologías para realizar inferencias sobre el número de conglomerados son inconsistentes, y la introducción de una estructura de dependencia entre los conglomerados implica dificultades adicionales en el proceso de estimación. En una configuración bayesiana, la agrupación se realiza considerando la partición desconocida como un objeto aleatorio y definiendo una distribución previa en ella. Esta distribución previa puede ser inducida por modelos sobre las observaciones o definida directamente para la partición. Sin embargo, varios resultados recientes han mostrado las dificultades para estimar consistentemente el número de conglomerados y, por lo tanto, la partición. El problema en sí de resumir la distribución posterior en la partición permanece abierto, dada la gran dimensión del espacio de la partición. Este trabajo tiene como objetivo revisar los enfoques bayesianos disponibles en la literatura para realizar clustering, presentando ventajas y desventajas de cada uno de ellos con el fin de sugerir futuras líneas de investigación.