Tesis - Maestría en Sistemas de Información mención en Data Science

Entérate cómo entregar tus trabajos de titulación

Permanent URI for this collection

https://repositorio.puce.edu.ec/handle/123456789/545

Browse

0-9ABCDEFGHIJKLMNOPQRSTUVWXYZ

Now showing 1 - 20 of 68

Open Access
Modelo matemático de exportaciones primarias y su impacto en el PIB del Ecuador. Periodo 2000-2022
(PUCE - Quito, 2022) Ramírez Samaniego, Carla Carmen; Prado Albornoz, Alfonso
Las exportaciones primarias conforman el 80% de las exportaciones totales del país, y es importante el análisis de su comportamiento tras la afectación por pandemia y en cómo se tradujo en la conformación del PIB del país. Por tanto, la tesis pretende llevar a cabo un análisis enfocado en desarrollar un conjunto de modelos matemáticos que permitan predecir el comportamiento de las exportaciones primarias de los principales productos de exportación del país y su impacto directo en el PIB. En primera instancia se aplicará técnicas estudiadas de series temporales, con el propósito de entender la volatilidad de cada uno de los productos en el transcurso del tiempo, los cuales conforman gran parte de las exportaciones totales del país y por ende afectan significativamente al producto interno del país (crecimiento del PIB). Finalmente se ejecutará un modelo de regresión, utilizando como variable dependiente al producto interno bruto, mientras que, como variables independientes a los factores de exportación de crudo, camarón y banano, todos expresados en miles de USD. El proyecto de investigación se limita a construir modelos univariantes para los principales productos de exportación, debido a que se requiere tener una idea de la exportación de cada uno de ellos expresados en miles de dólares FOB, y con eso finalmente cuantificar el impacto en el PIB del Ecuador. A través de la aplicación de este modelo se probará si efectivamente lo pronosticado en los modelos univariantes ARIMA afecta de manera positiva o negativa en el PIB del Ecuador al finalizar el año 2022, los cuales permitirán establecer un parámetro respecto al crecimiento económico del país dadas las condiciones de producción de cada uno de los productos más relevantes que son de exportación. Es importante entender que el papel de las exportaciones es vital en lo que concierne al desarrollo económico del Ecuador, de modo que este tipo de análisis resulta útil realizarlo tras haber pasado por una pandemia mundial especialmente para las economías de países latinoamericanos que fueron muy afectados; para las empresas especializadas en la exportación de los principales productos primarios del Ecuador, a quienes resulta transcendental entender el comportamiento exportador de la misma para así poder hallar oportunidades de crecimiento y tomar medidas en el caso de presentarse riesgos, y para el gobierno en general como una herramienta de planificación a fin de que exista una articulación entre la planificación nacional e institucional tomando en cuenta estos elementos orientadores.
Open Access
Análisis de sentimientos en redes sociales con aplicaciones en política ecuatoriana
(PUCE - Quito, 2022) Tupiza Baldez, Miguel Ángel; Calderón Serrano, Jorge Alfredo
La constante evolución y transformación de la realidad del mundo en el que vivimos trae consigo nuevas maneras de interactuar, informarnos y participar en casi todos los aspectos en los que antes lo hacíamos de manera restringida, por ejemplo, la política. La vía para informarnos solía ser la prensa, radio y televisión, limitando la fuente de información a espacios de horarios fijos, a márgenes de opiniones según las ideologías y empatías políticas de los medios de comunicación, la participación ciudadana se limitaba a las entrevistas con sus respectivas ediciones. Varios avances tecnológicos han traído consigo reducir esas brechas y permitir a las personas incluirse un poco más en temas que son de su interés. La capacidad de informarse está muy cerca, se la puede hacer en cualquier momento con solo utilizar un smartphone, es posible también opinar y debatir sobre los temas que generan interés o preocupación. No obstante, era de esperarse que el público pudiese ser muy diverso y podría ocasionar todo tipo de comentarios y reacciones entre ellos los poco acertados u ofensivos. Tampoco se puede dejar de lado que se pueda recurrir a trucos digitales para el aumento de la popularidad y seguidores falsos según la plataforma de difusión de contenido. Entonces se hace necesario combatir problemas nuevos con soluciones actuales, es por esto por lo que se plantea un modelo de participación ciudadana digital en asuntos de política nacional para identificar los posibles perfiles falsos y realizar un análisis de sentimientos de los participantes con el fin de tener una visión más realista de sus opiniones para hacerlas llegar a los interesados. Esto podría ayudar a un actor político a tener una realidad sobre la aceptación o no de sus electores para trabajar sobre aquello, manejándose todo sobre el marco adecuado de ética.
Open Access
Guía metodológica para la implementación de gobernanza de datos en la Empresa Universitaria de Salud EUS – EP de la Universidad de Cuenca
(PUCE - Quito, 2022) Morales Rodríguez, Andrea Daniela; Loza Aguirre, Edison Fernando
Actualmente, los datos y la información generada por estos se reconocen como un activo empresarial de vital importancia tanto en organizaciones públicas como privadas. La información se convierte en la principal generadora de valor estratégico y es utilizada para responder a las necesidades institucionales identificadas en la cadena de valor y para la toma de decisiones. La Empresa Universitaria de Salud EUS-EP, fue constituida por la Universidad de Cuenca en mayo de 2017, para desarrollar capacidades relacionadas con el diseño, planificación, ejecución y operación de proyectos en salud pública. La EUS - EP es la responsable de la administración del Centro de Especialidades Médicas – CEM de la Universidad de Cuenca, que es un centro de atención médica ambulatoria de segundo nivel. Actualmente, la EUS-EP, no cuenta con una Gobernanza de Datos implementada, existen varios custodios de los datos, pero no han sido identificados formalmente, tampoco dispone de un gobierno de datos formalizado y aprobado. Sus procedimientos creados previamente ya no responden a la realidad actual de la empresa debido al crecimiento exponencial que han logrado en el último año. Con estos antecedentes, surge la necesidad de desarrollar una Guía Metodológica para implementar una Gobernanza de datos para la EUS-EP. Esta guía, adaptada a los requerimientos y realidades de la EUS, combinaría dos marcos de referencia reconocidas en el medio, como son el marco de referencia “DAMA” para la gestión de datos, y la metodología de “Mejores prácticas”.
Open Access
Minería de datos para el modelado de aprendizaje automático en la resistencia de materiales por la inclusión de fibras naturales. Caso de estudio: Influencia de la inclusión de fibra de abacá en la resistencia a la compresión de limos arenosos, Laboratorio de, Mecánica de Suelos, Pavimentos y Geotécnica de la Pontificia Universidad Católica del Ecuador
(PUCE - Quito, 2022) Escobar Terán, Charles Edisson; Melgarejo Heredia, Rafael
El propósito del proyecto es buscar modelos de aprendizaje automático que permitan predecir la influencia de fibras naturales de abacá en la resistencia a la compresión de limos arenosos. Para el efecto, se aplicará el ciclo de vida de CRISP-DM1 a la data registrada en el Laboratorio de Resistencia de Materiales, Mecánica de Suelos, Pavimentos y Geotécnica de la PUCE. De encontrarse modelos de aprendizaje automático para este conjunto de datos, partiendo de casos particulares se podrá generalizar y predecir valores futuros de resistencia de materiales. Dentro de la metodología CRISP-DM, para seleccionar el modelo de aprendizaje de máquina será necesario experimentar con los datos disponibles y encontrar aquel en los que el error sea menor, de tal manera que la máquina pueda resolver situaciones con datos no conocidos. Los resultados serán evaluados y se seleccionará el que presente la mejor aproximación para entrenar una máquina. Una vez entrenada, se utilizarán nuevos datos de casos particulares, y se evaluará su despliegue. Si el despliegue no es satisfactorio será necesario argumentar las posibles razones por la que los datos no pudieran converger en un modelo de aprendizaje automático en cada una de las pruebas. Conforme a como se han planteado los objetivos, las etapas de Comprensión del negocio, Comprensión de datos y Preparación de datos se desarrollan en el acápite 4.1, mientras que el modelado se realiza en el 4.2, quedando la evaluación en el acápite 4.3.
Open Access
Predicción de la deserción estudiantil, mediante métricas y técnicas de minerías de datos, en el Instituto Superior Tecnológico Los Andes (ISTLA)
(PUCE - Quito, 2022) Cevallos Farías, Javier José; Melgarejo Heredia, Rafael
La deserción estudiantil en niveles de educación superior en la actualidad se ha convertido en un problema a nivel económico, social, comunitario y educativo a nivel mundial, puesto que una persona que no se encuentra con los conocimientos necesarios para enfrentar al entorno que le rodea tampoco le será posible ser competitivo y por lo tanto podría quedar rezagado del sistema económico, social, laboral, lo que estaría en detrimento de su calidad de vida. El presente proyecto tiene como objetivo determinar los factores de la deserción de los estudiantes del Instituto Superior Tecnológico Los Andes comprendida entre los periodos 2019 hasta el 2022. La metodología a utilizar es de tipo mixta, es decir cualitativa y cuantitativa, ya que por una parte se realizó un análisis objetivo del tema en cuestión y también resultados de la toma de datos con tablas de frecuencia, gráficos estadísticos, que detallan de forma lógica los factores de la deserción estudiantil en los sujetos de estudio. Se espera que este estudio sirva para identificar los factores que determinan la deserción estudiantil para posterior crear estrategias y tomar decisiones utilizando la minería de datos ya que se permitirá descubrir patrones de comportamiento a partir de un gran conjunto de datos. Y de esta manera aportar concientizando a la población estudiantil actual sobre la importancia del estudio para su vida profesional y personal pues una sociedad con educación es una sociedad con esperanza de obtener mejor estabilidad económica, laboral, social, y familiar.
Open Access
Estudio de mercado utilizando la red social Twitter, para Hoteles Decameron
(PUCE - Quito, 2022) Manosalvas Porras, Lennis Verónica; Calderón Serrano, Jorge Alfredo
En la actualidad, las empresas están adoptando nuevos enfoques, pues buscan llegar a sus clientes de forma personalizada para mejorar la calidad de sus servicios. Con el avance de la tecnología, cada día se genera grandes volúmenes de datos de forma digital. En este contexto, las redes sociales están adquiriendo un papel significativo, adoptándose como medios ampliamente usados para compartir diversas opiniones sobre un sin número de temas. Por tanto, estos datos se han convertido en una fuente valiosa para conocer los niveles de satisfacción de los usuarios. En el presente trabajo de titulación se realizará un estudio de mercado a través del análisis de opiniones expresadas vía Twitter sobre los servicios que ofrece Hoteles Decameron, mediante la aplicación de Minería de Datos y procesamiento de lenguaje natural (PLN), para determinar el grado de aceptación o rechazo hacia los servicios que ofrece la empresa. A través del análisis de sentimientos, se identificará si las opiniones son positivas, negativas o neutras. Además, se buscará palabras claves, que permitirán determinar niveles de acogida de los servicios ofrecidos por los Hoteles Decameron, dependiendo de los años de emisión de los Tweets y los segmentos geográficos de las personas que emitieron las opiniones. Asimismo, se realizará una encuesta de forma digital, con preguntas personalizadas sobre los servicios que ofrece Hoteles Decameron Mompiche, Hoteles Decameron Punta Centinela, Multivacaciones, estas opiniones permitirán complementar el análisis.
Open Access
Clasificación de los productos de una empresa de Quito considerando el recurso tiempo de mano de obra asignado a cada uno de sus procesos durante el año 2021- 2022 utilizando algoritmos de aprendizaje no supervisado
(PUCE - Quito, 2022) Guañuna Viteri, Norka Germania; Melgarejo Heredia, Rafael
Dentro de una organización se generan grandes cantidades de datos las mismas que al no ser utilizadas se convierten en información poco útil, por eso incursionar con este tema ayuda a visibilizar datos y problemas que al ser tomados en consideración y clasificados ayudarán a que la empresa actúe de forma oportuna frente a ellos sin esperar que estos se vuelvan más grandes e incontrolables. Al usar un exceso de mano de obra en un producto sube el precio del producto y también le resta el uso del recurso en otros procesos productivos que se encuentran planificados, si estos recursos se usan eficientemente la planificación programada se puede cumplir a cabalidad, cumpliendo con los requerimientos de los clientes a tiempo y aumentando así la confiabilidad de estos hacia la compañía ayudándole a que su posicionamiento en el mercado sea mucho mayor al que tiene actualmente.
Open Access
Análisis, diseño e implementación de una propuesta de modelo basado en machine learning para predecir los precios de las viviendas en un sector de la ciudad de Quito
(PUCE - Quito, 2023) Recuenco Canchala, Peter Vicente; Pincay Nieves, Jhonny Vladimir
La valoración catastral de las viviendas juega un papel crucial en la recaudación de impuestos y de la planificación urbana. En este contexto, esta investigación se centra en una propuesta de mejorar la precisión y eficiencia de los procesos de valoración catastral en la ciudad de Quito mediante la aplicación de análisis de datos y técnicas de aprendizaje automático, específicamente con modelos de regresión.El estudio aborda los retos inherentes a la revalorización y actualización de la base catastra, donde la agilidad y eficiencia son fundamentales para reflejar la valoración actual de los inmuebles y mejorar la recaudación del impuesto predial.Los objetivos específicos de esta investigación son analizar el impacto de las variables numéricas y categóricas en la valoración catastral, experimentar con diferentes modelos de regresión y seleccionar el que proporcione los mejores resultados en términos de precisión y facilidad de interpretación.Los resultados esperados podrán tener un impacto significativo en la valoración catastral, contribuyendo a optimizar la gestión tributaria y promoviendo la equidad en la distribución del impuesto predial. Además, sentará las bases para futuras investigaciones en el campo de la valoración catastral mediante técnicas de aprendizaje automático avanzados.
Open Access
Diseño de una solución de inteligencia de negocios (BI) que apoye en la toma de decisiones en el sector de la construcción
(PUCE - Quito, 2023) Sarango Rubio, Álvaro Javier; Melgarejo Heredia, Rafael
En la actualidad el análisis de las grandes cantidades de información marca un punto de inflexión en el sostenimiento y crecimiento tanto de empresas como de sectores productivos, el sector de la construcción representa para la economía ecuatoriana un eje de crecimiento significativo dado su injerencia en la generación de empleos, activación económica y atracción de inversión extranjera, contar con una herramienta que consolide información tanto histórica como actual representa una gran ventaja puesto que se puede potenciar el análisis no solo a nivel descriptivo sino también generar un valor agregado, la presente investigación tiene el objetivo del diseño y construcción de una solución de inteligencia de negocios que permita realizar un procesamiento y consolidación de datos utilizando la metodología CRISP- DM y técnicas de minería de datos para su posterior consumo a través de tableros de control utilizando la información de la encuesta ESED que proporciona estadísticas de edificaciones.
Open Access
Generación de Data warehouse para implementación de Business Intelligence que permita visualizar el comportamiento de los clientes y tomar medidas de acción comercial
(PUCE - Quito, 2023) Reyes Mena, Francisco Xavier; Montero Bermúdez, Eduardo José
El presente trabajo tiene como finalidad el desarrollo de un data warehouse, que permita ser de ayuda para el área comercial en una empresa PYMES dedicada a la distribución de equipos de telecomunicaciones. En la actualidad que una empresa cuente con un sistema de data warehouse donde pueda centralizar sus datos, permite generar respuestas proactivas y agilizar los procesos involucrados con el área de ventas para la toma de decisiones. Respuestas a las preguntas tales como: ¿qué ítem se vende con mayor frecuencia, ¿cuál es la región con mayor cantidad de clientes?, son de vital importancia para establecer nuevos planes comerciales.Por medio de información de ventas almacenada en formato CSV, desde el año 2014 al 2022, se ha generado un proceso de limpieza de datos que establece las variables relevantes, así como el formato adecuado. Además, se ha incurrido en la depuración de la información, ya que la misma contaba con errores producidos por ingreso manual. El archivo ha generado una tabla de hechos, la cual se cargó a un motor de visualización para generar una aplicación que despliegue la información relevante considerando: las ventas, los clientes, medidas de control y análisis multivariado.
Open Access
Diseño de un modelo predictivo de fuga de clientes utilizando algoritmos de Machine Learning
(PUCE - Quito, 2023) Navas Ayala, José Ricardo
El presente trabajo tiene como fin el desarrollo de un modelo predictivo utilizando algoritmos de Machine Learning para la predicción de los clientes que pueden llegar a convertirse en fuga, de tal manera que pueda ser una herramienta de alerta temprana para tomar acciones en cuanto a evitar que un cliente abandone la marca, incentivándolo nuevamente a realizar alguna compra ya sea esta por promociones o descuentos que se le pueda otorgar en determinados productos.Se empleó la metodología CRISP-DM para organizar de manera estructurada la información relevante y el flujo de actividades durante el desarrollo y evaluación del modelo predictivo. El modelo fue creado utilizando Python y se aprovecharon las bibliotecas de pandas y scikit-learn. Se eligió un algoritmo específico para desarrollar el modelo, el cual es el de árboles de decisión con 4 variables predictorasde tipo numérico, que fueron tomadas entre la recencia, frecuencia, valor monetario y RFM_Score. El modelo seleccionado es de suma utilidad para el negocio ya que ha resuelto un problema que venía manejando la corporación desde hace tiempo, al no poder identificar a sus clientes previamente antes de convertirse en fuga, siendo validado por los indicadores de precisión con 91.63%, una curva ROC_AUC de 95.40% y un recall de 96.3%. Con el modelo obtenido se obtuvo la base final que es exportada a Excel a través de una ruta compartida.
Open Access
Determinar el mejor algoritmo de ciencia de datos para una planificación académica automatizada para las IES del Ecuador
(PUCE - Quito, 2023) Hernández Toazo, Héctor Giovanny; Pincay Nieves, Jhonny Vladimir
Después de la pandemia las instituciones de educación superior apoyados por los órganos de control del Ecuador, han adoptado diferentes modelos y componentes de enseñanza denominados Sincrónico donde el estudiante a través de la tecnología puede unirse a las clases virtuales en tiempo real desde cualquier parte del mundo; Asincrónico, cuando el estudiante a través de una plataforma LMS (Sistema de Gestión de Aprendizaje), puede estudiar a cualquier hora con el material disponible en el sistema; y el último componente de aprendizaje es el Presencial, que permite que el alumno vaya a una interacción directa con el profesor.Con el avance de la tecnología, cada momento se genera volúmenes de datos de forma digital, y que mejor, utilizar la técnicas y algoritmos aprendidos en esta maestría de ciencia de datos, para aplicar en las diferentes etapas que con lleva la planificación académica.En el proceso de este trabajo se realizará entrevistas a los encargados de la planificación institucional y académica, con el fin de entender los pasos y metodologías que utilizan en la construcción de esta tarea que deben hacerlo a inicios de cada periodo académico, se modelara las tablas necesarias para que la información pueda ser tabulada e importada a las herramientas de Python.Una vez que se termine de modelar y entender, se llevará a Jupyter Notebook el conjunto de datos, para a través de modelos y técnicas de minería de datos pronosticar la oferta distributivo y horario académico.
Open Access
Modelo estadístico de puntaje de crédito (Scoring Credit) para la gestión de riesgo creditico
(PUCE - Quito, 2023) Jacho Parrales, Richard Álex; Prado Albornoz, Alfonso
El riesgo crediticio es una de las principales preocupaciones en el ámbito financiero, y se refiere a la probabilidad de que una empresa o individuo no pueda cumplir con sus obligaciones de pago. El riesgo crediticio puede ser originado por una serie de factores, como la falta de capacidad de pago, la falta de voluntad para pagar, o la incertidumbre económica. El riesgo crediticio es una preocupación importante para los prestamistas, ya que representa una amenaza para la rentabilidad y la estabilidad financiera. Por lo tanto, los prestamistas utilizan diversas herramientas para medir y gestionar el riesgo crediticio, como la evaluación de la solvencia de los prestatarios, la evaluación de la calidad de la garantía y la diversificación de la cartera de préstamos. En la actualidad, el riesgo crediticio se ha convertido en un tema cada vez más importante debido a la creciente complejidad del mercado financiero y la aparición de nuevos productos financieros. Los prestamistas y los prestatarios deben estar preparados para enfrentar y gestionar el riesgo crediticio de manera efectiva para garantizar la estabilidad financiera y el crecimiento económico. La gestión de riesgo crediticio es una herramienta fundamental para las empresas y los individuos que buscan obtener financiamiento, ya que les permite reducir el riesgo de incumplimiento y mejorar su capacidad de pago. En este sentido, es importante que los prestamistas y los prestatarios comprendan los fundamentos del riesgo crediticio y utilicen herramientas efectivas para su gestión. El presente trabajo tiene como objetivo analizar los factores que inciden en el crecimiento de la cartera vencida, que es uno de los principales indicadores del riesgo crediticio en las instituciones financieras.
Open Access
Implementación de un dashboard como herramienta para definir territorios de los visitadores médicos de un laboratorio farmacéutico en Ecuador
(PUCE - Quito, 2023) Lapuerta Paredes, Luis Fernando; Mora Londoño, Edison Vicente
El mercado farmacéutico en el Ecuador presenta falencias debido a las dificultades que tienen los laboratorios para asignar territorios a los visitadores médicos, volviendo la visita médica una actividad poco eficiente. Por esto, el presente trabajo tuvo como objetivo implementar un dashboard dinámico desarrollado en Qlik Sense como parte del proceso de asignación de territorios para la visita médica y de puntos de venta para generar incrementos en las ventas. La metodología utilizada tuvo un enfoque mixto (cualitativo y cuantitativo), y fue de alcance descriptivo. Se utilizaron las técnicas de investigación bibliográfica-documental y se realizó un proceso de desarrollo mediante el desarrollo del código propuesto a través de la metodología de desarrollo NoetixViews. El proceso de desarrollo constó de seis fases, desde la comprensión global del negocio desarrollado hasta su implantación y mantenimiento. El dashboard obtenido es una herramienta destinada a profesionales del área de inteligencia de negocios de laboratorios médicos que permite obtener una visualización sintética y actualizada de los puntos geográficos “calientes”, además de determinar la cantidad de médicos asignados a cada visitador por periodos de tiempo determinados; este dashboard presenta la información a nivel nacional, provincial y local, y permite modificar algunos parámetros y realizar el cálculo correspondiente a las cargas semanales de médicos para cada visitador, lo que mejorará la eficiencia en la asignación de tareas de venta y, a la larga, una mejora en el resultado de ventas.
Open Access
Minería de datos para segmentación de clientes en el Laboratorio Clínico particular Pura Vida
(PUCE - Quito, 2023) Ortiz Navarrete, Miguel Dimitri; Pincay Nieves, Jhonny Vladimir
La finalidad de este proyecto es aplicar técnicas de minería de datos que permitan obtener información que apoye a la toma de decisiones en el Laboratorio Clínico Pura Vida. El Laboratorio está ubicado en Quito, sector la Kennedy, dispone de infraestructura tecnológica para la elaboración de 203 pruebas de laboratorio clínico. El registro de la información tanto financiera como clínica se realiza en dos sistemas de información diferentes conocidos como CLINICAL Lab y SisGem respectivamente. La información de los sistemas se obtiene en formato xlsx o csv a través de los reportes que cada uno de estos sistemas posee; con esta información se inició el proceso ETL y CRISP-DM para la preparación de la data. Los datos del laboratorio son en su mayoría categóricos y de una alta dimensionalidad; en tal virtud se debe considerar modelos de agrupamiento por densidad. Se aplicó para el agrupamiento los modelos G-means, K-modes, DBSCAN. Los grupos obtenidos con estos modelos no son claros debido a la dimensionalidad de los datos y su estructura. Se aplicaron también algoritmos de asociación para identificar reglas de asociación que determinen el comportamiento del paciente. Los algoritmos de asociación implementados son A PRIORI y ECLAT, los dos algoritmos presentaron reglas de asociación a considerar por el negocio. Los algoritmos fueron desarrollados en código Python y se utilizó también BigML para identificar de forma ágil las características y patrones en la data. El análisis de esta información generó alternativas futuras para proyectos de investigación que permitan desarrollar sistemas de información que apoyen al diagnóstico y decisión de los profesionales de la salud.
Open Access
Implementación de un algoritmo ML de aprendizaje no supervisado para la creación de un cronograma de mantenimiento vial de las vías rurales de la provincia de Santo Domingo de los Tsáchilas
(PUCE - Quito, 2023) Pérez Huachamboza, Martín Mauricio; Montero Bermúdez, Eduardo José
Este trabajo investiga la optimización del mantenimiento vial en Santo Domingo de los Tsáchilas mediante el uso de algoritmos de Machine Learning no supervisados, específicamente a través del análisis de clústeres. Utilizando la metodología CRISP-DM, se analizaron datos históricos y actuales de las vías, enfocándose en variables como longitud, estado de la vía, y producción económica, para identificar patrones y priorizar intervenciones de mantenimiento. Los resultados muestran una segmentación efectiva de las vías que permite una planificación de mantenimiento más precisa y enfocada.
Open Access
Desarrollo de un modelo que prediga el nivel de contaminación del aire en la ciudad de Quito
(PUCE - Quito, 2023) Mora González, Bairon Hernán; Mora Londoño, Edison Vicente
La calidad del aire es un tema de creciente preocupación en las áreas urbanas debido a sus impactos negativos en la salud humana y el medio ambiente. Las ciudades experimentan altos niveles de contaminación atmosférica debido a la concentración de actividades industriales, el aumento del tráfico vehicular y otros factores antropogénicos. Quito, la capital de Ecuador, no es una excepción a esta problemática.El monitoreo y la predicción de la contaminación del aire en Quito son fundamentales para comprender la naturaleza y los patrones de la calidad del aire en la ciudad, así como para implementar medidas adecuadas de mitigación y control. Para lograrlo, es necesario contar con un modelo preciso que pueda predecir el nivel de contaminación del aire en función de los datos históricos disponibles.En este estudio, se propone el desarrollo de un modelo predictivo basado en estadísticas de bases de datos de años anteriores para predecir el nivel de contaminación del aire en la ciudad de Quito. El enfoque meso implica considerar la ciudad en su conjunto, abordando la variabilidad espacial y temporal de los contaminantes atmosféricos en diferentes zonas de la ciudad y en diferentes momentos del día.El modelo meso utilizará una combinación de datos meteorológicos, datos de emisiones y datos de calidad del aire recopilados a lo largo de varios años. Estos datos incluirán variables como la temperatura, la humedad, la velocidad del viento, la precipitación, las emisiones industriales y vehiculares, así como las concentraciones históricas de contaminantes como partículas PM2.5, dióxido de nitrógeno (NO2), ozono (O3) y otros contaminantes relevantes.Además del enfoque meso, es importante considerar el ámbito micro en el desarrollo de un modelo predictivo para la contaminación del aire en la ciudad de Quito. El ámbito micro se refiere a la escala más localizada, donde se tienen en cuenta factores como la topografía, la densidad de población y las características específicas de los diferentes barrios y áreas urbanas.La contaminación del aire puede variar significativamente dentro de una ciudad debido a la presencia de fuentes de emisión específicas, como fábricas, áreas industriales, zonas de alta densidad de tráfico o áreas verdes. Estas variaciones pueden influir en la calidad del aire en diferentes vecindarios y en diferentes momentos del día.El objeto de estudio de esta investigación científica es el nivel de contaminación del aire en la ciudad de Quito. El objetivo es comprender la dinámica de la contaminación atmosférica en la ciudad, identificar los factores que influyen en ella y desarrollar un modelo predictivo que pueda estimar con precisión los niveles de contaminación en función de datos estadísticos disponibles recopilados de años anteriores.El campo de estudio abarca la calidad del aire en Quito, centrándose en la recopilación, análisis e interpretación de datos relacionados con la contaminación atmosférica. Se explorarán diferentes aspectos dentro de este campo, como la variabilidad espacial y temporal de los contaminantes, las fuentes de emisión, los factores meteorológicos y las características urbanas que influyen en la calidad del aire. Este modelo utilizará técnicas de análisis de datos y aprendizaje automático para establecer relaciones entre los factores que influyen en la contaminación del aire y los niveles de contaminantes registrados en el pasado.
Open Access
Modelo predictivo aplicando algoritmos de Machine Learning para la producción lechera en la hacienda el prado, del Instituto Agropecuario Superior Andino (IASA)
(PUCE - Quito, 2023) Ordoñez Merino, Jorge Isaac
El presente trabajo tiene como fin el desarrollo de un aplicativo web aplicando algoritmos de Machine Learning para la predicción de la producción lechera, de tal manera que pueda ser utilizado en programas de mejoramiento genético y en la toma de decisiones de los administradores de la ganadería del Instituto Agropecuario Superior Andino IASA. La ganadería mencionada se ubica en la Sierra Norte del Ecuador, tiene un sistema de producción de pastoreo, y cuanta con ejemplares de las razas Holstein y las del producto de la cruza Montbéliarde x Holstein. El sistema en pastoreo es influenciado por variables exógenas al sistema, que son determinadas por factores agroecológicos y de manejo de praderas, cuya influencia tiene variación local. Se utilizó la metodología CRISP-DM para sistematizar la información clave y el flujo de actividades para el desarrollo y posterior evaluación del modelo predictivo. El modelo se desarrolló con Python con el uso de las librerías pandas y scikit-learn. El algoritmo seleccionado para el desarrollo del modelo fue el de regresión lineal múltiple, con 17 variables predictoras, que fueron tomadas entre los factores productivos, reproductivos y ambientales. El modelo obtenido es útil para la predicción de la producción lechera, siendo validado por los indicadores R2ajsutado de 0.80 y razón entre la raíz del error cuadrático y la media de producción total de 0.11. Con el modelo obtenido se desarrolló el aplicativo web utilizando la plataforma Stramlit, de tal manera que el acceso al mismo sea público.
Open Access
Análisis comparativo de algoritmos de Machine Learning aplicados en la gestión de riesgos cuantitativos en proyectos predictivos y adaptativos
(PUCE - Quito, 2023) Osejo Domínguez, Francisco Miguel; Espinosa Viteri, Luis Oswaldo
El presente trabajo tiene como fin, realizar el análisis comparativo de la aplicación de algoritmos de Machine Learning en la gestión de riesgos cuantitativos en proyectos predictivos y adaptativos. Los algoritmos seleccionados para el desarrollo de los modelos fueron: Simulación de Monte Carlo aplicando Distribución Triangular y Beta – Pert, Regresión Lineal Simple, Regresión Lineal Múltiple y Arboles de Decisión. Se utilizó la metodología CRISP-DM para sistematizar la información y el flujo de actividades para el desarrollo y posterior evaluación de los modelos analizados. Los modelos se desarrollaron con Python, los datasets seleccionados son relacionados a cronograma y presupuesto de la automatización del sistema BAS y seguridad electrónica de un proyecto del sector de la construcción. Se detalla los análisis e interpretación de los resultados y coeficientes obtenidos en el desarrollo de cada uno de los algoritmos aplicados. Se obtiene un análisis comparativo de la aplicación de los algoritmos seleccionados, modelos y resultados obtenidos, así como las conclusiones y recomendaciones pertinentes.
Open Access
Rendimiento académico de los estudiantes de educación secundaria en el Ecuador período 2021-2022
(PUCE - Quito, 2023) Cabrera Barbecho, Fanny Narcisa; Melgarejo Heredia, Rafael
El acceso a la educación superior en Ecuador enfrenta obstáculos significativos debido a diversos factores, como la calidad de la educación secundaria. El rendimiento académico de los estudiantes de bachillerato desempeña un papel crucial en la probabilidad de acceder a una institución de educación superior. Para ser admitidos, los estudiantes deben cumplir ciertos requisitos mínimos, incluyendo el puntaje del examen Ser Estudiante y el promedio académico logrado en la secundaria. Este estudio examina el rendimiento académico de los estudiantes de bachillerato en Ecuador durante el período 2021-2022, utilizando la metodología CRISP DM y técnicas de aprendizaje automático basadas en los datos del Instituto Nacional de Evaluación Educativa. La investigación emplea una variedad de métodos supervisados para predecir el rendimiento académico, incluyendo Regresión lineal múltiple, K vecinos cercanos, Árbol de decisión, Random forest, Elastic NET y Gradient Boosting. Además, se aborda la clasificación del nivel de rendimiento como elemental o insuficiente mediante el uso de modelos como Logit, K vecinos más cercanos, Árbol de decisión, Random forest, Naive bayes, Gradient boosting y Multilayer perceptron. En última instancia, se implementan enfoques no supervisados, tales como K-means, DBSCAN (Density-Based Spatial Clustering of Applications with Noise) y Agglomerative clustering, con el objetivo de identificar grupos distintivos de estudiantes. Los resultados revelan que el rendimiento académico se ve afectado por factores como el nivel socioeconómico, la región y el área de ubicación de la institución educativa. Asimismo, aspectos institucionales, como el tipo de institución, y características educativas del estudiante, como la cantidad de horas y días dedicados a las tareas y la pérdida de años escolares, influyen en el rendimiento del bachiller. Se determinó que la satisfacción del estudiante con su entorno familiar también incide en su desempeño académico. A través del análisis, se identificaron tres grupos de estudiantes para los cuales se pueden proponer estrategias de mejora específicas. Estos hallazgos brindan información valiosa para apoyar la toma de decisiones informadas en relación con la educación secundaria en Ecuador.

Browse

Browsing Tesis - Maestría en Sistemas de Información mención en Data Science by Issue Date

Results Per Page

Sort Options