Pincay Nieves, Jhonny VladimirOrtiz Navarrete, Miguel Dimitri26/11/202326/11/20232023https://repositorio.puce.edu.ec/handle/123456789/32480La finalidad de este proyecto es aplicar técnicas de minería de datos que permitan obtener información que apoye a la toma de decisiones en el Laboratorio Clínico Pura Vida. El Laboratorio está ubicado en Quito, sector la Kennedy, dispone de infraestructura tecnológica para la elaboración de 203 pruebas de laboratorio clínico. El registro de la información tanto financiera como clínica se realiza en dos sistemas de información diferentes conocidos como CLINICAL Lab y SisGem respectivamente. La información de los sistemas se obtiene en formato xlsx o csv a través de los reportes que cada uno de estos sistemas posee; con esta información se inició el proceso ETL y CRISP-DM para la preparación de la data. Los datos del laboratorio son en su mayoría categóricos y de una alta dimensionalidad; en tal virtud se debe considerar modelos de agrupamiento por densidad. Se aplicó para el agrupamiento los modelos G-means, K-modes, DBSCAN. Los grupos obtenidos con estos modelos no son claros debido a la dimensionalidad de los datos y su estructura. Se aplicaron también algoritmos de asociación para identificar reglas de asociación que determinen el comportamiento del paciente. Los algoritmos de asociación implementados son A PRIORI y ECLAT, los dos algoritmos presentaron reglas de asociación a considerar por el negocio. Los algoritmos fueron desarrollados en código Python y se utilizó también BigML para identificar de forma ágil las características y patrones en la data. El análisis de esta información generó alternativas futuras para proyectos de investigación que permitan desarrollar sistemas de información que apoyen al diagnóstico y decisión de los profesionales de la salud.esMinería de datosInvestigación de mercadosLaboratorios clínicosMinería de datos para segmentación de clientes en el Laboratorio Clínico particular Pura Vida