Tesis - Maestría en Sistemas de Información mención en Data Science

Entérate cómo entregar tus trabajos de titulación

Permanent URI for this collection

https://repositorio.puce.edu.ec/handle/123456789/545

Browse

0-9ABCDEFGHIJKLMNOPQRSTUVWXYZ

Now showing 1 - 12 of 12

Open Access
Análisis de sentimientos utilizando la red social “X” Twitter para medir el nivel de aceptación del nuevo presidente del Ecuador, Daniel Noboa (noviembre 2023 - abril 2024)
(PUCE - Quito, 2024) Cedeño Menéndez, Roly Steeven; Montero Bermúdez, Eduardo José
El presente trabajo se centra en analizar los sentimientos expresados en la red social “X” Twitter con respecto al presidente Daniel Noboa, con el objetivo de determinar el nivel de aceptación por parte de la población ecuatoriana durante el período comprendido desde el 23 de noviembre de 2023 hasta el 30 de abril de 2024. Para ello, se identificaron y recopilaron 3177 tweets relevantes utilizando técnicas de web scraping, aplicando filtros específicos para excluir tweets con imágenes, videos y retweets.La cuantificación y categorización de las respuestas hacia el presidente revelaron una predominancia de tweets neutrales del 79.7%, indicando una percepción mayormente neutral. Sin embargo, se observó una notable cantidad de críticas, representadas por el 16.6% de los tweets negativos, y relativamente pocos elogios, con solo el 3.7% de los tweets siendo positivos.Los modelos de análisis de sentimientos utilizados incluyeron Naive Bayes, Support Vector Machine (SVM), Logistic Regression, Decision Tree, Random Forest y XGBoost. Cada modelo fue evaluado utilizando métricas como exactitud, precisión, recall y F1-Score, tanto en los datos de entrenamiento como en los de prueba.Los resultados mostraron variaciones significativas en el rendimiento de los modelos, destacándose que el modelo de Naive Bayes presentó un buen equilibrio en las métricas de exactitud y F1-Score, siendo el más adecuado para los datos desbalanceados. Las conclusiones sugieren que, aunque se obtuvieron resultados satisfactorios, es recomendable extender el período de estudio, incorporar otras redes sociales, incluir retweets y respuestas, y explorar modelos de análisis más avanzados para mejorar la precisión.
Open Access
Análisis predictivo de la demanda de especies valoradas en el consulado del Ecuador en Queens, Estados Unidos de América
(PUCE - Quito, 2024) Chiza Monarco, Víctor Alfonso; Melgarejo Heredia, Rafael
La optimización de la gestión del stock de especies valoradas y la eficiente asignación de este tipo de recursos en el Consulado del Ecuador en Queens son fundamentales para garantizar un servicio consular ágil y efectivo a los ciudadanos ecuatorianos en Estados Unidos. Dada la variedad de trámites consulares y la necesidad de contar con las especies valoradas adecuadas para cada uno, es muy importante comprender y prever la demanda de estos recursos de manera precisa.El análisis y la predicción de la demanda de especies valoradas permitirán al Consulado anticipar las necesidades futuras de trámites consulares y planificar apropiadamente el abastecimiento de especies valoradas en su stock. Esto no solo mejorará la eficiencia en la prestación de servicios consulares, sino que también evitará la escasez o el exceso de estos insumos, optimizando así el uso de recursos financieros y logísticos.Al implementar este proyecto, se espera mejorar significativamente la calidad y la eficiencia de los servicios consulares ofrecidos por el Consulado del Ecuador en Queens, lo que contribuirá a fortalecer la relación entre la comunidad ecuatoriana residente en Estados Unidos y las autoridades consulares. Además, esta iniciativa ayudará a promover una gestión más transparente y eficaz de los recursos públicos asignados a los servicios consulares.
Open Access
Análisis predictivo del churn de clientes para una empresa proveedora del servicio de internet para hogares en el Ecuador
(PUCE - Quito, 2024) Chuquer Erazo, William Hernán; Pincay Nieves, Jhonny Vladimir
El presente estudio se enfoca en el desarrollo de un modelo predictivo para identificar el churn de clientes en una empresa proveedora del servicio de internet para hogares en el Ecuador. Utilizando la metodología CRISP-DM, en la fase de preparación de los datos se realizó un análisis exploratorio utilizando Python, lo que permitió identificar patrones preliminares en el comportamiento de los clientes. En las fases posteriores, se utilizaron herramientas como Alteryx, que facilitó la creación de flujos de trabajo para lograr un análisis exhaustivo de los datos de clientes, aplicando técnicas de limpieza, segmentación y parametrización para garantizar la calidad y relevancia de la información. Qlik Sense fue empleada para lograr una visualización clara y efectiva de los resultados. La técnica de WOE + IV fue crucial para la segmentación y parametrización de variables, mejorando la precisión predictiva.Se entrenaron y compararon varios modelos de machine learning, entre ellos, Regresión Logística, Árboles de Decisión y Random Forest, siendo este último el modelo con el mejor desempeño. Random Forest alcanzó una precisión del 99.5% para la predicción de cancelaciones administrativas y del 81% para cancelaciones voluntarias. Estos resultados proporcionan a la empresa herramientas sólidas para la implementación de estrategias de retención de clientes, permitiendo una intervención proactiva en la gestión de riesgos y mejorando la satisfacción del cliente. El estudio también destaca la importancia de actualizar periódicamente los modelos para adaptarse a cambios en los patrones de comportamiento de los clientes.
Open Access
Automatización de la logística de última milla mediante técnicas de inteligencia artificial
(PUCE - Quito, 2024) Tamayo Proaño, Sebastián Felipe; Mora Londoño, Edison Vicente
El presente trabajo de titulación corresponde al desarrollo de LUMA (Logística de Ultima Milla Automatizada) cuyo enfoque consiste en la automatización de la fase de planificación de la asignación de mercancías a vehículos de despacho.A lo largo de cada capítulo, se detallan los procesos que fueron empleados para el desarrollo de LUMA, entre ellos, se utilizaron técnicas de aprendizaje no supervisado mediante la agrupación en clústeres que permitió identificar sectores de entrega a los que, posteriormente, se les asigno vehículos de despacho de acuerdo con un algoritmo que fue desarrollado para dicho propósito; para que, finalmente, las mercancías identificadas de cada sector, sean atribuidas a los vehículos correspondientes.Sin embargo, para esto se tuvo que realizar una exploración y preparación de datos con registros históricos de mercancías despachadas, donde, se emplearon diversas técnicas para identificar parámetros óptimos que permitieron obtener un resultado adecuado del modelo de agrupación en clústeres.Finalmente, se demostró que la propuesta de solución para la optimización de la logística de última milla, basada en el uso de aprendizaje no supervisado y la agrupación en clústeres, tuvo éxito al disminuir los porcentajes de subutilización de vehículos en cuanto a sus capacidades.
Open Access
Clasificación de clientes y predicción de deserciones usando algoritmos K-means y regresión logística
(PUCE - Quito, 2023) Torres Flores, Raúl Alejandro; Calderón Serrano, Jorge Alfredo
El análisis de la deserción de clientes se ha vuelto un desafío común en muchas organizaciones, dado que comprender a fondo las razones detrás de la pérdida de clientes resulta crucial para el éxito y la continuidad de cualquier empresa. En este contexto, este trabajo propone el uso de dos enfoques complementarios: el algoritmo no supervisado K-Means y el algoritmo supervisado Regresión Logística. Por un lado, el algoritmo K-Means permite explorar datos no etiquetados en busca de patrones y segmentos ocultos que puedan revelar información valiosa sobre la deserción de clientes. Por otro lado, la Regresión Logística se emplea para construir modelos que predigan la probabilidad de que un cliente abandone su servicio, basándose en variables relevantes del negocio. La combinación de estos enfoques de análisis brinda una comprensión más profunda y precisa del comportamiento de los clientes, lo cual resulta fundamental para que las empresas puedan adaptar estrategias efectivas de retención y fidelización permitiéndoles tomar decisiones informadas y proactivas, implementando acciones que reduzcan la pérdida de clientes y aumenten la satisfacción y lealtad.
Open Access
Clasificación de los productos de una empresa de Quito considerando el recurso tiempo de mano de obra asignado a cada uno de sus procesos durante el año 2021- 2022 utilizando algoritmos de aprendizaje no supervisado
(PUCE - Quito, 2022) Guañuna Viteri, Norka Germania; Melgarejo Heredia, Rafael
Dentro de una organización se generan grandes cantidades de datos las mismas que al no ser utilizadas se convierten en información poco útil, por eso incursionar con este tema ayuda a visibilizar datos y problemas que al ser tomados en consideración y clasificados ayudarán a que la empresa actúe de forma oportuna frente a ellos sin esperar que estos se vuelvan más grandes e incontrolables. Al usar un exceso de mano de obra en un producto sube el precio del producto y también le resta el uso del recurso en otros procesos productivos que se encuentran planificados, si estos recursos se usan eficientemente la planificación programada se puede cumplir a cabalidad, cumpliendo con los requerimientos de los clientes a tiempo y aumentando así la confiabilidad de estos hacia la compañía ayudándole a que su posicionamiento en el mercado sea mucho mayor al que tiene actualmente.
Open Access
Desarrollo de un algoritmo basado en redes neuronales para la identificación automática del melanoma mediante el análisis de imágenes
(PUCE - Quito, 2025) León Alarcón, José Alberto; Escobar Terán, Charles Edisson
El presente trabajo tiene como propósito la implementación y desarrollo de un algoritmo basado en redes neuronales convolucionales, buscando optimizar la eficiencia y precisión en la identificación del Melanoma. Este incluye la revisión exhaustiva de la literatura para informar sobre el estado actual del campo de estudio, la recopilación y preparación de un banco de datos utilizando algoritmos y técnicas como DullRazor y Unsharp Masking, el diseño e implementación de una arquitectura de CNN adaptada a la detección del Melanoma y la evaluación del modelo propuesto mediante métricas de evaluación.La evaluación del modelo demostró́ un funcionamiento superior en términos de clasificación de imágenes, obteniendo una exactitud del 97.77% en datos de prueba. Además, se reportaron métricas basadas en predicciones como: Precisión, exactitud, Recall, puntuación F1 las cuales obtuvieron valores altamente aceptables. Siendo así, este algoritmo de red neuronal convolucional resultó en una mejora significativa en la eficiencia y precisión del diagnóstico dermatológico.Este proyecto no solo aborda una problemática clave en el diagnóstico del melanoma, sino que también presenta una contribución significativa al área emergente de la ciencia de datos aplicada a la salud. El resultado de este trabajo propiciaría una base para futuras investigaciones y desarrollos en la intersección entre la ciencia de datos y la medicina.
Open Access
Diseño de un modelo predictivo de fuga de clientes utilizando algoritmos de Machine Learning
(PUCE - Quito, 2023) Navas Ayala, José Ricardo
El presente trabajo tiene como fin el desarrollo de un modelo predictivo utilizando algoritmos de Machine Learning para la predicción de los clientes que pueden llegar a convertirse en fuga, de tal manera que pueda ser una herramienta de alerta temprana para tomar acciones en cuanto a evitar que un cliente abandone la marca, incentivándolo nuevamente a realizar alguna compra ya sea esta por promociones o descuentos que se le pueda otorgar en determinados productos.Se empleó la metodología CRISP-DM para organizar de manera estructurada la información relevante y el flujo de actividades durante el desarrollo y evaluación del modelo predictivo. El modelo fue creado utilizando Python y se aprovecharon las bibliotecas de pandas y scikit-learn. Se eligió un algoritmo específico para desarrollar el modelo, el cual es el de árboles de decisión con 4 variables predictorasde tipo numérico, que fueron tomadas entre la recencia, frecuencia, valor monetario y RFM_Score. El modelo seleccionado es de suma utilidad para el negocio ya que ha resuelto un problema que venía manejando la corporación desde hace tiempo, al no poder identificar a sus clientes previamente antes de convertirse en fuga, siendo validado por los indicadores de precisión con 91.63%, una curva ROC_AUC de 95.40% y un recall de 96.3%. Con el modelo obtenido se obtuvo la base final que es exportada a Excel a través de una ruta compartida.
Open Access
Minería de datos para el modelado de aprendizaje automático en la resistencia de materiales por la inclusión de fibras naturales. Caso de estudio: Influencia de la inclusión de fibra de abacá en la resistencia a la compresión de limos arenosos, Laboratorio de, Mecánica de Suelos, Pavimentos y Geotécnica de la Pontificia Universidad Católica del Ecuador
(PUCE - Quito, 2022) Escobar Terán, Charles Edisson; Melgarejo Heredia, Rafael
El propósito del proyecto es buscar modelos de aprendizaje automático que permitan predecir la influencia de fibras naturales de abacá en la resistencia a la compresión de limos arenosos. Para el efecto, se aplicará el ciclo de vida de CRISP-DM1 a la data registrada en el Laboratorio de Resistencia de Materiales, Mecánica de Suelos, Pavimentos y Geotécnica de la PUCE. De encontrarse modelos de aprendizaje automático para este conjunto de datos, partiendo de casos particulares se podrá generalizar y predecir valores futuros de resistencia de materiales. Dentro de la metodología CRISP-DM, para seleccionar el modelo de aprendizaje de máquina será necesario experimentar con los datos disponibles y encontrar aquel en los que el error sea menor, de tal manera que la máquina pueda resolver situaciones con datos no conocidos. Los resultados serán evaluados y se seleccionará el que presente la mejor aproximación para entrenar una máquina. Una vez entrenada, se utilizarán nuevos datos de casos particulares, y se evaluará su despliegue. Si el despliegue no es satisfactorio será necesario argumentar las posibles razones por la que los datos no pudieran converger en un modelo de aprendizaje automático en cada una de las pruebas. Conforme a como se han planteado los objetivos, las etapas de Comprensión del negocio, Comprensión de datos y Preparación de datos se desarrollan en el acápite 4.1, mientras que el modelado se realiza en el 4.2, quedando la evaluación en el acápite 4.3.
Open Access
Modelo predictivo aplicando algoritmos de Machine Learning para la producción lechera en la hacienda el prado, del Instituto Agropecuario Superior Andino (IASA)
(PUCE - Quito, 2023) Ordoñez Merino, Jorge Isaac
El presente trabajo tiene como fin el desarrollo de un aplicativo web aplicando algoritmos de Machine Learning para la predicción de la producción lechera, de tal manera que pueda ser utilizado en programas de mejoramiento genético y en la toma de decisiones de los administradores de la ganadería del Instituto Agropecuario Superior Andino IASA. La ganadería mencionada se ubica en la Sierra Norte del Ecuador, tiene un sistema de producción de pastoreo, y cuanta con ejemplares de las razas Holstein y las del producto de la cruza Montbéliarde x Holstein. El sistema en pastoreo es influenciado por variables exógenas al sistema, que son determinadas por factores agroecológicos y de manejo de praderas, cuya influencia tiene variación local. Se utilizó la metodología CRISP-DM para sistematizar la información clave y el flujo de actividades para el desarrollo y posterior evaluación del modelo predictivo. El modelo se desarrolló con Python con el uso de las librerías pandas y scikit-learn. El algoritmo seleccionado para el desarrollo del modelo fue el de regresión lineal múltiple, con 17 variables predictoras, que fueron tomadas entre los factores productivos, reproductivos y ambientales. El modelo obtenido es útil para la predicción de la producción lechera, siendo validado por los indicadores R2ajsutado de 0.80 y razón entre la raíz del error cuadrático y la media de producción total de 0.11. Con el modelo obtenido se desarrolló el aplicativo web utilizando la plataforma Stramlit, de tal manera que el acceso al mismo sea público.
Open Access
Segmentación de donantes potenciales de una fundación mediante algoritmos de aprendizaje automático
(PUCE - Quito, 2024) Carlozama Villota, Juan Carlos; Melgarejo Heredia, Rafael
La presente tesis tiene como objetivo desarrollar un modelo de segmentación de donantes potenciales para una fundación, utilizando algoritmos de aprendizaje automático.Este proyecto busca identificar variables clave para la segmentación basada en comportamientos y patrones de donación, recopilar datos relevantes sobre donantes, y evaluar la precisión y eficiencia del algoritmo implementado. La metodología utilizada se basa en el enfoque CRISPDM y se aplicarán técnicas de aprendizaje no supervisado.
Open Access
Sistema de recuperación de imágenes de signos distintivos, basado en machine learning
(PUCE - Quito, 2024) Yanangómez Suárez, Michael Jamil; Loza Aguirre, Edison Fernando
La inteligencia artificial y el aprendizaje automático están revolucionando la manera en que procesamos y analizamos datos en diversas áreas, desde la medicina hasta la ingeniería y, más recientemente, en el campo de la propiedad intelectual. El aprendizaje automático, permite a los sistemas aprender y mejorar a partir de la experiencia y permiten gestionar grandes volúmenes de datos con una precisión y velocidad que superan las capacidades humanas.La propiedad intelectual en Ecuador enfrenta desafíos únicos, especialmente en la gestión y protección de derechos intelectuales asociados a signos distintivos como los logos; tareas que están a cargo del SENADI. Tradicionalmente, la revisión de logos para garantizar su originalidad y evitar infracciones ha sido una tarea manual, llevada a cabo por expertos que pueden fácilmente verse abrumados por la creciente cantidad de datos visuales. Esta metodología no solo es propensa a errores, sino también insostenible en el largo plazo dada la alta frecuencia de solicitudes de registro.Este proyecto busca abordar esta problemática mediante la creación de un sistema diseñado para mejorar significativamente la precisión y eficiencia en la identificación de logos similares. El proceso comenzó con la creación de un extenso repositorio de imágenes, las cuales fueron normalizadas para asegurar la uniformidad, ajustando su tamaño sin alterar las proporciones originales, mediante el relleno de espacios para mantener la integridad visual.Utilizando la red neuronal convolucional VGG19, seleccionada por su eficacia sobre algoritmos similares, el modelo fue entrenado para reconocer y comparar patrones gráficos eficazmente. Este entrenamiento se llevó a cabo tanto de forma independiente como mediante el uso de la librería DeepImageSearch, que facilita la integración de algoritmos de aprendizaje profundo en aplicaciones de búsqueda de imágenes.Para evaluar la efectividad del sistema, se realizaron pruebas con repositorios de menor tamaño, donde las imágenes fueron clasificadas manualmente para luego comparar estos resultados con las predicciones del modelo.Se desarrolló también un sistema web en el lenguaje Java, con login institucional para usuarios autorizados. Esta plataforma permite seleccionar una imagen cualquiera del computador, la cual se la normaliza para su análisis mediante el modelo entrenado en Python, y posteriormente presentará logos similares encontrados. Al posicionarse sobre cualquier logo resultante, el sistema muestra detalles completos del signo distintivo asociado, como la denominación, el trámite, fecha de presentación entre otras cosas. Esta funcionalidad proporciona a los analistas del SENADI todas las herramientas necesarias para decidir sobre el registro de nuevos logos, mejorando así la gestión de los derechos intelectuales y la protección contra posibles infracciones.

Browse

Browsing Tesis - Maestría en Sistemas de Información mención en Data Science by Subject "Algoritmos computacionales"

Results Per Page

Sort Options