Tesis - Maestría en Sistemas de Información mención en Data Science
Permanent URI for this collection
Browse
Browsing Tesis - Maestría en Sistemas de Información mención en Data Science by Issue Date
Now showing 1 - 20 of 36
Results Per Page
Sort Options
Item Open Access Predicción de la deserción estudiantil, mediante métricas y técnicas de minerías de datos, en el Instituto Superior Tecnológico Los Andes (ISTLA)(PUCE - Quito, 2022-10-31) Cevallos Farías, Javier José; Melgarejo Heredia, RafaelLa deserción estudiantil en niveles de educación superior en la actualidad se ha convertido en un problema a nivel económico, social, comunitario y educativo a nivel mundial, puesto que una persona que no se encuentra con los conocimientos necesarios para enfrentar al entorno que le rodea tampoco le será posible ser competitivo y por lo tanto podría quedar rezagado del sistema económico, social, laboral, lo que estaría en detrimento de su calidad de vida. El presente proyecto tiene como objetivo determinar los factores de la deserción de los estudiantes del Instituto Superior Tecnológico Los Andes comprendida entre los periodos 2019 hasta el 2022. La metodología a utilizar es de tipo mixta, es decir cualitativa y cuantitativa, ya que por una parte se realizó un análisis objetivo del tema en cuestión y también resultados de la toma de datos con tablas de frecuencia, gráficos estadísticos, que detallan de forma lógica los factores de la deserción estudiantil en los sujetos de estudio. Se espera que este estudio sirva para identificar los factores que determinan la deserción estudiantil para posterior crear estrategias y tomar decisiones utilizando la minería de datos ya que se permitirá descubrir patrones de comportamiento a partir de un gran conjunto de datos. Y de esta manera aportar concientizando a la población estudiantil actual sobre la importancia del estudio para su vida profesional y personal pues una sociedad con educación es una sociedad con esperanza de obtener mejor estabilidad económica, laboral, social, y familiar.Item Open Access Clasificación de los productos de una empresa de Quito considerando el recurso tiempo de mano de obra asignado a cada uno de sus procesos durante el año 2021- 2022 utilizando algoritmos de aprendizaje no supervisado(PUCE - Quito, 2022-12-16) Guañuna Viteri, Norka Germania; Melgarejo Heredia, RafaelDentro de una organización se generan grandes cantidades de datos las mismas que al no ser utilizadas se convierten en información poco útil, por eso incursionar con este tema ayuda a visibilizar datos y problemas que al ser tomados en consideración y clasificados ayudarán a que la empresa actúe de forma oportuna frente a ellos sin esperar que estos se vuelvan más grandes e incontrolables. Al usar un exceso de mano de obra en un producto sube el precio del producto y también le resta el uso del recurso en otros procesos productivos que se encuentran planificados, si estos recursos se usan eficientemente la planificación programada se puede cumplir a cabalidad, cumpliendo con los requerimientos de los clientes a tiempo y aumentando así la confiabilidad de estos hacia la compañía ayudándole a que su posicionamiento en el mercado sea mucho mayor al que tiene actualmente.Item Open Access Guía metodológica para la implementación de gobernanza de datos en la Empresa Universitaria de Salud EUS – EP de la Universidad de Cuenca(PUCE - Quito, 2022-12-31) Morales Rodríguez, Andrea Daniela; Loza Aguirre, Edison FernandoActualmente, los datos y la información generada por estos se reconocen como un activo empresarial de vital importancia tanto en organizaciones públicas como privadas. La información se convierte en la principal generadora de valor estratégico y es utilizada para responder a las necesidades institucionales identificadas en la cadena de valor y para la toma de decisiones. La Empresa Universitaria de Salud EUS-EP, fue constituida por la Universidad de Cuenca en mayo de 2017, para desarrollar capacidades relacionadas con el diseño, planificación, ejecución y operación de proyectos en salud pública. La EUS - EP es la responsable de la administración del Centro de Especialidades Médicas – CEM de la Universidad de Cuenca, que es un centro de atención médica ambulatoria de segundo nivel. Actualmente, la EUS-EP, no cuenta con una Gobernanza de Datos implementada, existen varios custodios de los datos, pero no han sido identificados formalmente, tampoco dispone de un gobierno de datos formalizado y aprobado. Sus procedimientos creados previamente ya no responden a la realidad actual de la empresa debido al crecimiento exponencial que han logrado en el último año. Con estos antecedentes, surge la necesidad de desarrollar una Guía Metodológica para implementar una Gobernanza de datos para la EUS-EP. Esta guía, adaptada a los requerimientos y realidades de la EUS, combinaría dos marcos de referencia reconocidas en el medio, como son el marco de referencia “DAMA” para la gestión de datos, y la metodología de “Mejores prácticas”.Item Open Access Modelo matemático de exportaciones primarias y su impacto en el PIB del Ecuador. Periodo 2000-2022(PUCE - Quito, 2022-12-31) Ramírez Samaniego, Karla Carmen; Prado Albornoz, AlfonsoLas exportaciones primarias conforman el 80% de las exportaciones totales del país, y es importante el análisis de su comportamiento tras la afectación por pandemia y en cómo se tradujo en la conformación del PIB del país. Por tanto, la tesis pretende llevar a cabo un análisis enfocado en desarrollar un conjunto de modelos matemáticos que permitan predecir el comportamiento de las exportaciones primarias de los principales productos de exportación del país y su impacto directo en el PIB. En primera instancia se aplicará técnicas estudiadas de series temporales, con el propósito de entender la volatilidad de cada uno de los productos en el transcurso del tiempo, los cuales conforman gran parte de las exportaciones totales del país y por ende afectan significativamente al producto interno del país (crecimiento del PIB). Finalmente se ejecutará un modelo de regresión, utilizando como variable dependiente al producto interno bruto, mientras que, como variables independientes a los factores de exportación de crudo, camarón y banano, todos expresados en miles de USD. El proyecto de investigación se limita a construir modelos univariantes para los principales productos de exportación, debido a que se requiere tener una idea de la exportación de cada uno de ellos expresados en miles de dólares FOB, y con eso finalmente cuantificar el impacto en el PIB del Ecuador. A través de la aplicación de este modelo se probará si efectivamente lo pronosticado en los modelos univariantes ARIMA afecta de manera positiva o negativa en el PIB del Ecuador al finalizar el año 2022, los cuales permitirán establecer un parámetro respecto al crecimiento económico del país dadas las condiciones de producción de cada uno de los productos más relevantes que son de exportación. Es importante entender que el papel de las exportaciones es vital en lo que concierne al desarrollo económico del Ecuador, de modo que este tipo de análisis resulta útil realizarlo tras haber pasado por una pandemia mundial especialmente para las economías de países latinoamericanos que fueron muy afectados; para las empresas especializadas en la exportación de los principales productos primarios del Ecuador, a quienes resulta transcendental entender el comportamiento exportador de la misma para así poder hallar oportunidades de crecimiento y tomar medidas en el caso de presentarse riesgos, y para el gobierno en general como una herramienta de planificación a fin de que exista una articulación entre la planificación nacional e institucional tomando en cuenta estos elementos orientadores.Item Open Access Minería de datos para el modelado de aprendizaje automático en la resistencia de materiales por la inclusión de fibras naturales. Caso de estudio: Influencia de la inclusión de fibra de abacá en la resistencia a la compresión de limos arenosos, Laboratorio de, Mecánica de Suelos, Pavimentos y Geotécnica de la Pontificia Universidad Católica del Ecuador(PUCE - Quito, 2022-12-31) Escobar Terán, Charles Edisson; Melgarejo Heredia, RafaelEl propósito del proyecto es buscar modelos de aprendizaje automático que permitan predecir la influencia de fibras naturales de abacá en la resistencia a la compresión de limos arenosos. Para el efecto, se aplicará el ciclo de vida de CRISP-DM1 a la data registrada en el Laboratorio de Resistencia de Materiales, Mecánica de Suelos, Pavimentos y Geotécnica de la PUCE. De encontrarse modelos de aprendizaje automático para este conjunto de datos, partiendo de casos particulares se podrá generalizar y predecir valores futuros de resistencia de materiales. Dentro de la metodología CRISP-DM, para seleccionar el modelo de aprendizaje de máquina será necesario experimentar con los datos disponibles y encontrar aquel en los que el error sea menor, de tal manera que la máquina pueda resolver situaciones con datos no conocidos. Los resultados serán evaluados y se seleccionará el que presente la mejor aproximación para entrenar una máquina. Una vez entrenada, se utilizarán nuevos datos de casos particulares, y se evaluará su despliegue. Si el despliegue no es satisfactorio será necesario argumentar las posibles razones por la que los datos no pudieran converger en un modelo de aprendizaje automático en cada una de las pruebas. Conforme a como se han planteado los objetivos, las etapas de Comprensión del negocio, Comprensión de datos y Preparación de datos se desarrollan en el acápite 4.1, mientras que el modelado se realiza en el 4.2, quedando la evaluación en el acápite 4.3.Item Open Access Estudio de mercado utilizando la red social Twitter, para Hoteles Decameron(PUCE - Quito, 2022-12-31) Manosalvas Porras, Lennis Verónica; Calderón Serrano, Jorge AlfredoEn la actualidad, las empresas están adoptando nuevos enfoques, pues buscan llegar a sus clientes de forma personalizada para mejorar la calidad de sus servicios. Con el avance de la tecnología, cada día se genera grandes volúmenes de datos de forma digital. En este contexto, las redes sociales están adquiriendo un papel significativo, adoptándose como medios ampliamente usados para compartir diversas opiniones sobre un sin número de temas. Por tanto, estos datos se han convertido en una fuente valiosa para conocer los niveles de satisfacción de los usuarios. En el presente trabajo de titulación se realizará un estudio de mercado a través del análisis de opiniones expresadas vía Twitter sobre los servicios que ofrece Hoteles Decameron, mediante la aplicación de Minería de Datos y procesamiento de lenguaje natural (PLN), para determinar el grado de aceptación o rechazo hacia los servicios que ofrece la empresa. A través del análisis de sentimientos, se identificará si las opiniones son positivas, negativas o neutras. Además, se buscará palabras claves, que permitirán determinar niveles de acogida de los servicios ofrecidos por los Hoteles Decameron, dependiendo de los años de emisión de los Tweets y los segmentos geográficos de las personas que emitieron las opiniones. Asimismo, se realizará una encuesta de forma digital, con preguntas personalizadas sobre los servicios que ofrece Hoteles Decameron Mompiche, Hoteles Decameron Punta Centinela, Multivacaciones, estas opiniones permitirán complementar el análisis.Item Open Access Análisis de sentimientos en redes sociales con aplicaciones en política ecuatoriana(PUCE - Quito, 2022-12-31) Tupiza Baldez, Miguel Ángel; Calderón Serrano, Jorge AlfredoLa constante evolución y transformación de la realidad del mundo en el que vivimos trae consigo nuevas maneras de interactuar, informarnos y participar en casi todos los aspectos en los que antes lo hacíamos de manera restringida, por ejemplo, la política. La vía para informarnos solía ser la prensa, radio y televisión, limitando la fuente de información a espacios de horarios fijos, a márgenes de opiniones según las ideologías y empatías políticas de los medios de comunicación, la participación ciudadana se limitaba a las entrevistas con sus respectivas ediciones. Varios avances tecnológicos han traído consigo reducir esas brechas y permitir a las personas incluirse un poco más en temas que son de su interés. La capacidad de informarse está muy cerca, se la puede hacer en cualquier momento con solo utilizar un smartphone, es posible también opinar y debatir sobre los temas que generan interés o preocupación. No obstante, era de esperarse que el público pudiese ser muy diverso y podría ocasionar todo tipo de comentarios y reacciones entre ellos los poco acertados u ofensivos. Tampoco se puede dejar de lado que se pueda recurrir a trucos digitales para el aumento de la popularidad y seguidores falsos según la plataforma de difusión de contenido. Entonces se hace necesario combatir problemas nuevos con soluciones actuales, es por esto por lo que se plantea un modelo de participación ciudadana digital en asuntos de política nacional para identificar los posibles perfiles falsos y realizar un análisis de sentimientos de los participantes con el fin de tener una visión más realista de sus opiniones para hacerlas llegar a los interesados. Esto podría ayudar a un actor político a tener una realidad sobre la aceptación o no de sus electores para trabajar sobre aquello, manejándose todo sobre el marco adecuado de ética.Item Open Access Diseño de una solución de inteligencia de negocios (BI) que apoye en la toma de decisiones en el sector de la construcción(PUCE - Quito, 2023) Sarango Rubio, Álvaro Javier; Melgarejo Heredia, RafaelEn la actualidad el análisis de las grandes cantidades de información marca un punto de inflexión en el sostenimiento y crecimiento tanto de empresas como de sectores productivos, el sector de la construcción representa para la economía ecuatoriana un eje de crecimiento significativo dado su injerencia en la generación de empleos, activación económica y atracción de inversión extranjera, contar con una herramienta que consolide información tanto histórica como actual representa una gran ventaja puesto que se puede potenciar el análisis no solo a nivel descriptivo sino también generar un valor agregado, la presente investigación tiene el objetivo del diseño y construcción de una solución de inteligencia de negocios que permita realizar un procesamiento y consolidación de datos utilizando la metodología CRISP- DM y técnicas de minería de datos para su posterior consumo a través de tableros de control utilizando la información de la encuesta ESED que proporciona estadísticas de edificaciones.Item Open Access Modelo matemático para proyectar el crecimiento poblacional de las especies demersales con el fin de sugerir áreas sensibles o resilientes de la Reserva Marina de Galápagos (RMG)(PUCE - Quito, 2023) Jitala Simbaña, Cristian Enrique; Albornoz, Alfonso PradoEl presente trabajo de investigación busca explorar como han venido fluctuando las poblaciones de peces demersales en la Reserva Marina de Galápagos, a través de información espacio-temporal, recopilada por la Fundación Charles Darwin por medio del proyecto de Monitoreo Ecológico Submareal. Mediante la aplicación de un modelo matemático se procura descubrir la dinámica de las poblaciones, proyectando su crecimiento o disminución en el tiempo, considerando para algunos casos un factor extractivo. Todo el trabajo de investigación está basado en la metodología CRISP-DM, lo cual permite aplicar un proceso estándar y sistemático a través de las distintas fases para extraer conocimiento útil de los datos disponibles sobre las características, el comportamiento y la dinámica de las poblaciones. Este trabajo concluye con la presentación de los resultados previa evaluación a las poblaciones de especies que muestran alguna preocupación por su decremento en un momento dado.Item Open Access Implementación de un algoritmo ML de aprendizaje no supervisado para la creación de un cronograma de mantenimiento vial de las vías rurales de la provincia de Santo Domingo de los Tsáchilas(PUCE - Quito, 2023) Pérez Huachamboza, Martín Mauricio; Montero Bermúdez, Eduardo JoséEste trabajo investiga la optimización del mantenimiento vial en Santo Domingo de los Tsáchilas mediante el uso de algoritmos de Machine Learning no supervisados, específicamente a través del análisis de clústeres. Utilizando la metodología CRISP-DM, se analizaron datos históricos y actuales de las vías, enfocándose en variables como longitud, estado de la vía, y producción económica, para identificar patrones y priorizar intervenciones de mantenimiento. Los resultados muestran una segmentación efectiva de las vías que permite una planificación de mantenimiento más precisa y enfocada.Item Open Access Modelo predictivo aplicando algoritmos de Machine Learning para la producción lechera en la hacienda el prado, del Instituto Agropecuario Superior Andino (IASA)(PUCE - Quito, 2023-01-31) Ordoñez Merino, Jorge IsaacEl presente trabajo tiene como fin el desarrollo de un aplicativo web aplicando algoritmos de Machine Learning para la predicción de la producción lechera, de tal manera que pueda ser utilizado en programas de mejoramiento genético y en la toma de decisiones de los administradores de la ganadería del Instituto Agropecuario Superior Andino IASA. La ganadería mencionada se ubica en la Sierra Norte del Ecuador, tiene un sistema de producción de pastoreo, y cuanta con ejemplares de las razas Holstein y las del producto de la cruza Montbéliarde x Holstein. El sistema en pastoreo es influenciado por variables exógenas al sistema, que son determinadas por factores agroecológicos y de manejo de praderas, cuya influencia tiene variación local. Se utilizó la metodología CRISP-DM para sistematizar la información clave y el flujo de actividades para el desarrollo y posterior evaluación del modelo predictivo. El modelo se desarrolló con Python con el uso de las librerías pandas y scikit-learn. El algoritmo seleccionado para el desarrollo del modelo fue el de regresión lineal múltiple, con 17 variables predictoras, que fueron tomadas entre los factores productivos, reproductivos y ambientales. El modelo obtenido es útil para la predicción de la producción lechera, siendo validado por los indicadores R2ajsutado de 0.80 y razón entre la raíz del error cuadrático y la media de producción total de 0.11. Con el modelo obtenido se desarrolló el aplicativo web utilizando la plataforma Stramlit, de tal manera que el acceso al mismo sea público.Item Open Access Minería de datos para segmentación de clientes en el Laboratorio Clínico particular Pura Vida(PUCE - Quito, 2023-01-31) Ortiz Navarrete, Miguel Dimitri; Pincay Nieves, Jhonny VladimirLa finalidad de este proyecto es aplicar técnicas de minería de datos que permitan obtener información que apoye a la toma de decisiones en el Laboratorio Clínico Pura Vida. El Laboratorio está ubicado en Quito, sector la Kennedy, dispone de infraestructura tecnológica para la elaboración de 203 pruebas de laboratorio clínico. El registro de la información tanto financiera como clínica se realiza en dos sistemas de información diferentes conocidos como CLINICAL Lab y SisGem respectivamente. La información de los sistemas se obtiene en formato xlsx o csv a través de los reportes que cada uno de estos sistemas posee; con esta información se inició el proceso ETL y CRISP-DM para la preparación de la data. Los datos del laboratorio son en su mayoría categóricos y de una alta dimensionalidad; en tal virtud se debe considerar modelos de agrupamiento por densidad. Se aplicó para el agrupamiento los modelos G-means, K-modes, DBSCAN. Los grupos obtenidos con estos modelos no son claros debido a la dimensionalidad de los datos y su estructura. Se aplicaron también algoritmos de asociación para identificar reglas de asociación que determinen el comportamiento del paciente. Los algoritmos de asociación implementados son A PRIORI y ECLAT, los dos algoritmos presentaron reglas de asociación a considerar por el negocio. Los algoritmos fueron desarrollados en código Python y se utilizó también BigML para identificar de forma ágil las características y patrones en la data. El análisis de esta información generó alternativas futuras para proyectos de investigación que permitan desarrollar sistemas de información que apoyen al diagnóstico y decisión de los profesionales de la salud.Item Open Access Aplicación de técnicas de agrupamiento para caracterizar patrones de siniestros viales en Ecuador en el año 2021(PUCE - Quito, 2023-04-01) Maza Jara, Edwin Alcides; Calderón Serrano, Jorge AlfredoEl presente trabajo de investigación aplicada realiza un estudio sobre los patrones de siniestralidad vial del Ecuador en el año 2021, utilizando modelos no supervisados de agrupamiento de forma que se pueda caracterizar los grupos más comunes en causar accidentes viales. Para el desarrollo de la investigación aplicada se utiliza la metodología de minería de datos CRIPS DM, la cual permite entender la problemática y establecer los objetivos a resolver en sus diferentes fases. Finalmente se provee información adecuada de las características y grupos que más incidencia tienen en los accidentes de tránsito en Ecuador.Item Open Access Rendimiento académico de los estudiantes de educación secundaria en el Ecuador período 2021-2022(PUCE - Quito, 2023-05-11) Cabrera Barbecho, Fanny Narcisa; Melgarejo Heredia, RafaelEl acceso a la educación superior en Ecuador enfrenta obstáculos significativos debido a diversos factores, como la calidad de la educación secundaria. El rendimiento académico de los estudiantes de bachillerato desempeña un papel crucial en la probabilidad de acceder a una institución de educación superior. Para ser admitidos, los estudiantes deben cumplir ciertos requisitos mínimos, incluyendo el puntaje del examen Ser Estudiante y el promedio académico logrado en la secundaria. Este estudio examina el rendimiento académico de los estudiantes de bachillerato en Ecuador durante el período 2021-2022, utilizando la metodología CRISP DM y técnicas de aprendizaje automático basadas en los datos del Instituto Nacional de Evaluación Educativa. La investigación emplea una variedad de métodos supervisados para predecir el rendimiento académico, incluyendo Regresión lineal múltiple, K vecinos cercanos, Árbol de decisión, Random forest, Elastic NET y Gradient Boosting. Además, se aborda la clasificación del nivel de rendimiento como elemental o insuficiente mediante el uso de modelos como Logit, K vecinos más cercanos, Árbol de decisión, Random forest, Naive bayes, Gradient boosting y Multilayer perceptron. En última instancia, se implementan enfoques no supervisados, tales como K-means, DBSCAN (Density-Based Spatial Clustering of Applications with Noise) y Agglomerative clustering, con el objetivo de identificar grupos distintivos de estudiantes. Los resultados revelan que el rendimiento académico se ve afectado por factores como el nivel socioeconómico, la región y el área de ubicación de la institución educativa. Asimismo, aspectos institucionales, como el tipo de institución, y características educativas del estudiante, como la cantidad de horas y días dedicados a las tareas y la pérdida de años escolares, influyen en el rendimiento del bachiller. Se determinó que la satisfacción del estudiante con su entorno familiar también incide en su desempeño académico. A través del análisis, se identificaron tres grupos de estudiantes para los cuales se pueden proponer estrategias de mejora específicas. Estos hallazgos brindan información valiosa para apoyar la toma de decisiones informadas en relación con la educación secundaria en Ecuador.Item Open Access Implementación de un dashboard como herramienta para definir territorios de los visitadores médicos de un laboratorio farmacéutico en Ecuador(PUCE - Quito, 2023-05-24) Lapuerta Paredes, Luis Fernando; Mora Londoño, Édison VicenteEl mercado farmacéutico en el Ecuador presenta falencias debido a las dificultades que tienen los laboratorios para asignar territorios a los visitadores médicos, volviendo la visita médica una actividad poco eficiente. Por esto, el presente trabajo tuvo como objetivo implementar un dashboard dinámico desarrollado en Qlik Sense como parte del proceso de asignación de territorios para la visita médica y de puntos de venta para generar incrementos en las ventas. La metodología utilizada tuvo un enfoque mixto (cualitativo y cuantitativo), y fue de alcance descriptivo. Se utilizaron las técnicas de investigación bibliográfica-documental y se realizó un proceso de desarrollo mediante el desarrollo del código propuesto a través de la metodología de desarrollo NoetixViews. El proceso de desarrollo constó de seis fases, desde la comprensión global del negocio desarrollado hasta su implantación y mantenimiento. El dashboard obtenido es una herramienta destinada a profesionales del área de inteligencia de negocios de laboratorios médicos que permite obtener una visualización sintética y actualizada de los puntos geográficos “calientes”, además de determinar la cantidad de médicos asignados a cada visitador por periodos de tiempo determinados; este dashboard presenta la información a nivel nacional, provincial y local, y permite modificar algunos parámetros y realizar el cálculo correspondiente a las cargas semanales de médicos para cada visitador, lo que mejorará la eficiencia en la asignación de tareas de venta y, a la larga, una mejora en el resultado de ventas.Item Open Access Estudio comparativo de la precisión de algoritmos de aprendizaje automático, regresión logística, máquinas de soporte y clasificador bayesiano, basado en la implementación de modelo predictivos en función de la mortalidad en accidentes en Ecuador(PUCE - Quito, 2023-06) Salgado Escobar, Stalin Sebastián; Mora Londoño, Edison VicenteEl estudio actual se enfoca en un estudio comparativo de tres modelos predictivos que permita establecer el más preciso en el escenario planteado, construidos mediante el uso de técnicas de minería de datos, basado en el estudio de la mortalidad en accidentes de tráfico en Ecuador. El país se enfrenta una tasa de mortalidad en accidentes de tráfico muy alta, transformándose en uno de los mayores problemas dentro del país y reducir es uno de los objetivos prioritarios para la agencia nacional de tránsito del país, dicho estudio se justifica en función de la necesidad de desarrollar herramientas más efectivas para reducir la tasa de mortalidad en accidentes de tránsito, los accidentes de tráfico son una causa importante de mortalidad, y es necesario adoptar nuevas estrategias para abordar este problema de manera más efectiva. El uso de técnicas de minería de datos y modelos predictivos puede ser una forma efectiva de analizar y predecir la mortalidad en accidentes de tráfico. Varios de los ítems identificados en los accidentes de tráfico en el Ecuador se basan en detalles como infraestructura vial deficiente, falta de cultura vial, falta de educación vial, pésima señalización en algunos escenarios. Estos factores aumentan el riesgo de accidentes de tránsito, y por consiguiente el riesgo de pérdidas humanas. El objetivo principal de este estudio es desarrollar un modelo predictivo que permita predecir la mortalidad en accidentes de tránsito en Ecuador mediante el uso de técnicas de minería de datos y modelos predictivos, donde por medio de recopilar los datos históricos, selección de variables relevantes, implementación de técnicas de aprendizaje automático supervisado y evaluar la capacidad predictiva del modelo propuesto podamos entregar una herramienta que permita tomar decisiones más informadas y efectivas en la prevención de accidentes de tráfico y la reducción de la mortalidad. Los datos históricos de accidentes de tráfico en Ecuador se recopilarán de registro de accidentes publicado por agencia nacional de tránsito (ANT), entre los años 2017 y 2022.Item Open Access Segmentación de clientes (socios) para la recomendación de productos de colocación y/o captación para institución financiera en Ecuador(PUCE - Quito, 2023-06-01) Chapa Zumba, Cristina Victoria; Pincay Nieves, Jhonny VladimirLa segmentación de clientes permite a las instituciones financieras mejorar su estrategia de negocio, centrándose en su mercado objetivo mediante campañas de marketing dirigidas. Las instituciones al no disponer de técnicas para segmentar a sus clientes se les dificultan llegar a sus objetivos, asumiendo mayor riesgo en nichos de mercados desconocidos. El objetivo del presente estudio es recomendar productos financieros a clientes potenciales de una institución financiera del Ecuador mediante la técnica de machine learning, clúster k-means. La base de información son los clientes de la institución financiera del Ecuador con sus características corte diciembre del 2022; se emplea un enfoque transversal para la aplicación del modelo. Los resultados muestran que la técnica de clúster recomienda segmentar en diez grupos a los clientes, siendo potenciales tres, desde el punto de vista de la demanda que tienen en cualquiera de los productos de crédito, tarjetas de crédito, ahorro, y depósitos a plazo fijo.Item Open Access Clasificación de clientes y predicción de deserciones usando algoritmos K-means y regresión logística(PUCE - Quito, 2023-06-01) Torres Flores, Raúl Alejandro; Calderón Serrano, Jorge AlfredoEl análisis de la deserción de clientes se ha vuelto un desafío común en muchas organizaciones, dado que comprender a fondo las razones detrás de la pérdida de clientes resulta crucial para el éxito y la continuidad de cualquier empresa. En este contexto, este trabajo propone el uso de dos enfoques complementarios: el algoritmo no supervisado K-Means y el algoritmo supervisado Regresión Logística. Por un lado, el algoritmo K-Means permite explorar datos no etiquetados en busca de patrones y segmentos ocultos que puedan revelar información valiosa sobre la deserción de clientes. Por otro lado, la Regresión Logística se emplea para construir modelos que predigan la probabilidad de que un cliente abandone su servicio, basándose en variables relevantes del negocio. La combinación de estos enfoques de análisis brinda una comprensión más profunda y precisa del comportamiento de los clientes, lo cual resulta fundamental para que las empresas puedan adaptar estrategias efectivas de retención y fidelización permitiéndoles tomar decisiones informadas y proactivas, implementando acciones que reduzcan la pérdida de clientes y aumenten la satisfacción y lealtad.Item Open Access Diseño de un modelo predictivo de fuga de clientes utilizando algoritmos de Machine Learning(PUCE - Quito, 2023-06-01) Navas Ayala, José Ricardo; S/NEl presente trabajo tiene como fin el desarrollo de un modelo predictivo utilizando algoritmos de Machine Learning para la predicción de los clientes que pueden llegar a convertirse en fuga, de tal manera que pueda ser una herramienta de alerta temprana para tomar acciones en cuanto a evitar que un cliente abandone la marca, incentivándolo nuevamente a realizar alguna compra ya sea esta por promociones o descuentos que se le pueda otorgar en determinados productos.Se empleó la metodología CRISP-DM para organizar de manera estructurada la información relevante y el flujo de actividades durante el desarrollo y evaluación del modelo predictivo. El modelo fue creado utilizando Python y se aprovecharon las bibliotecas de pandas y scikit-learn. Se eligió un algoritmo específico para desarrollar el modelo, el cual es el de árboles de decisión con 4 variables predictorasde tipo numérico, que fueron tomadas entre la recencia, frecuencia, valor monetario y RFM_Score. El modelo seleccionado es de suma utilidad para el negocio ya que ha resuelto un problema que venía manejando la corporación desde hace tiempo, al no poder identificar a sus clientes previamente antes de convertirse en fuga, siendo validado por los indicadores de precisión con 91.63%, una curva ROC_AUC de 95.40% y un recall de 96.3%. Con el modelo obtenido se obtuvo la base final que es exportada a Excel a través de una ruta compartida.Item Open Access Aplicación de inteligencia artificial mediante el uso de machine learning para el proceso de clasificación de datos asociados al Centro Médico CMC(PUCE - Quito, 2023-06-12) Espín Espín, Deysi Magaly; Espinosa Viteri, Luis OswaldoLa inteligencia artificial y el aprendizaje automático han revolucionado muchos campos, incluido el ámbito médico. El Centro Médico CMC ha reconocido el potencial de estas tecnologías y se ha permitido aplicar la inteligencia artificial en la información que posee para clasificar los datos asociados. El proceso de clasificación de datos en un Centro Médico puede ser complejo debido a la gran cantidad de información generada. El uso de machine learning permite que el sistema aprenda automáticamente a partir de los datos existentes y genere modelos predictivos. En el caso del Centro Médico CMC, se utilizan algoritmos de aprendizaje automático para analizar y clasificar los datos de manera precisa, eficiente y estos pueden contribuir significativamente a mejorar la atención prestada a los pacientes. El primer paso en el proceso está en la preparación de los datos. Esto implica recopilar y limpiar los datos, eliminando cualquier información redundante o ruidosa. A continuación, se seleccionan las características relevantes. Una vez que los datos están preparados, se utilizan el algoritmo árbol de decisión y regresión logística múltiple. Durante el entrenamiento, el modelo aprende a reconocer patrones y relaciones en los datos para realizar predicciones precisas. Después del entrenamiento, el modelo se evalúa utilizando datos de prueba para medir su rendimiento y precisión. Los beneficios de la aplicación de inteligencia artificial y machine learning en el proceso de clasificación de datos asociados al Centro Médico CMC son diversos. Permite una clasificación más rápida y precisa de los datos, lo que mejora la eficiencia y la toma de decisiones del centro médico.