Tesis - Maestría en Biología Computacional

Entérate cómo entregar tus trabajos de titulación
Permanent URI for this collection
Browse
Browsing Tesis - Maestría en Biología Computacional by Author "Cervantes Pérez, Sergio Alan"
Now showing 1 - 10 of 10
Results Per Page
Sort Options
Item Open Access
Análisis comparativo del genoma de Acinetobacter baumannii de cepas resistentes y sensibles a antibióticos(PUCE - Quito, 2025) Lunavictoria Beltrán, Julio Fabricio; Cervantes Pérez, Sergio AlanLas bacterias multirresistentes son una amenaza global que cada año afecta la salud pública; Acinetobacter baumannii se ha consolidado como un modelo de estudio debido a su notable plasticidad genética y resistencia bacteriana, por ende, comprender sus mecanismos genéticos que producen este fenómeno es crucial para el desarrollo de nuevas estrategias terapéuticas y control sanitario. La presente investigación tuvo como objetivo analizar y comparar el genoma de Acinetobacter baumannii de cepas resistentes y sensibles antibióticos mediante datos de bases de datos públicas para identificar genes asociados a la resistencia y posibles mecanismos de patogenicidad. En la actualidad la multirresistencia bacteriana es problema crítico de salud pública por el abuso y mal uso de los antibióticos aumentando así la propagación de cepas bacterianas oportunista multirresistentes. Acinetobacter baumannii es un cocobacilo gramnegativo, no fermentador, oxidasa y catalasa positivo, inmóvil y aerobio estricto que en los últimos años debido su genoma plástico y varios mecanismos de resistencia se ha convertido en uno de los patógenos de prioridad crítica de la OMS (Organización Mundial de la Salud). Debido a la complicada multirresistencia microbiana que sufre el mundo actual y en especial de Acinetobacter baumannii se planteó el problema de análisis comparativo del genoma de A. baumannii de cepas sensibles a antibióticos y de cepas multirresistentes para de esta manera lograr vislumbrar mecanismos genéticos clave que intervienen en la resistencia bacteriana. La metodología aplicada en el siguiente proyecto de investigación fue la siguiente: búsqueda y obtención de los genomas de Acinetobacter baumannii de la base de datos pública disponible en BV-BRC, la selección de cada genoma se basó en algunos criterios para filtrar únicamente genomas viables (completitud genómica, disponibilidad de información como: plataforma de secuenciación, sensibilidad fenotípica), se seleccionaron 28 genomas y se descargaron en formato FASTA renombrando cada uno según corresponda; 14 genomas sensibles y 14 genomas resistentes fueron seleccionados a cada uno de los antibióticos (ciprofloxacino, gentamicina, ceftazidime, levofloxacina, tetraciclina, trimethoprim/sulphamethoxazole, amikacina, tobramicina, imipinem, meropenem, ampicilina/sulbactam, carbapenem, ceftriaxona y ampicilina); la validación de la calidad se realizó mediante Quast y Busco; la comparación de la cepa sensible contra la resistente se lo realizó con Nucmer del paquete MUMmer, se filtró este output con Delta-Filter y se graficó el alineamiento con MUMerplot; para la determinación de cambios estructurales más detallados de uso DNAdiff y finalmente para el análisis filogenético se usó IQ-TREE con su visualización en iTol. Los resultados obtenidos de la investigación fueron desglosados por cada paso aplicado en la metodología: la calidad del ensamblaje de los 28 genomas escogidos resultó de alta calidad, la cobertura promedio de todos los genomas fue del 91,87%, la media de indels de los 28 genomas de 2532,28 y el número de SNPs de 64065; los gráficos obtenidos con MUMmerplot mostraron alto grado de plasticidad genómica asociado a la resistencia antibiótica, en las cepas resistentes se observó una pérdida de colinearidad (presencia de inversiones, traslocaciones, inserciones y deleciones); con respecto a los genes de resistencia encontrados fue un total de 725 genes en conjunto de la base de datos CARD (319 genes en las cepas sensibles y 406 en cepas resistentes), en la base de datos ResFinder se encontraron 258 genes (163 para cepas sensibles y 95 para resistentes), el mismo grupo de genes frecuentaban en ambos fenotipos de sensibilidad con CARD y en ResFinder en cepas resistentes frecuentaban blaADC-25_1, APH(6)-Id, blaOXA-23_1, mph(E)_1, msr(E)_1 y en cepas sensibles frecuentaban blaADC-25_1 y sul1_5; finalmente lo que respecta al análisis filogenético, al árbol indicó una baja variación genética (baja distancia evolutiva entre genomas) con una distribución en diferentes ramas de las cepas sensibles y resistentes sin agruparse por sensibilidad indicando una resistencia no monofilética y sin correlación directa entre la resistencia bacteriana y la filogenia, más bien la resistencia es causada por genes de resistencia adquiridos de forma independiente por ejemplo transferencia horizontal de genes.Item Open Access
Análisis computacional del microbioma del suelo en maní (Arachis hypogaea L.) en respuesta a la inoculación de Trichoderma harzianumITEM 3636(PUCE - Quito, 2025) Alba Nepas, Jessica Maribel; Cervantes Pérez, Sergio AlanEl cultivo de maní (Arachis hypogaeaL.) es crucial económica y nutricionalmente, pero su producción enfrenta desafíos. La inoculación con microorganismos beneficiosos como Trichoderma harzianumes una estrategia sostenible prometedora. Este estudio tuvo como objetivo evaluar, mediante análisis computacional, el impacto de la inoculación de T. harzianumITEM 3636 en la composición y funcionalidad del microbioma bacteriano del suelo en cultivos de maní, utilizando datos públicos de secuenciación del amplicón16S rRNA (Proyecto SRA: PRJNA471338) correspondientes a dos periodos (2014-15 y 2015-16) y tres condiciones: suelo inicial (CondicionIni), suelo con maní sin inocular (Tratamiento Control) y suelo con maní inoculado (Inoculación Tricho). Se aplicó un pipeline bioinformático en R (DADA2, phyloseq, vegan, micro eco) para control de calidad, inferencia de ASVs, asignación taxonómica (SILVA), análisis de diversidad alfa/beta y predicción funcional (FAPROTAX). Los resultados mostraron datos de alta calidad y profundidad de secuenciación adecuada. Se identificó un núcleo bacteriano estable (Gemmatimonas, Acidiferrimicrobium, Candidatus Solibacter, Sphingomonas) y una alta proporción de taxones raros. La diversidad alfa fue menor en la condición inicial, pero similar entre los tratamientos control e inoculación. La diversidad beta reveló diferencias significativas globales (PERMANOVA), pero el análisis RDA indicó que la variación temporal (Año) fue un factor más influyente que el tratamiento per seen la estructura comunitaria. Sin embargo, la inoculación conT. harzianumITEM 3636se asoció significativamente con un mayor potencial funcional inferido para ciclos clave de nitrógeno (oxidación de amonio, nitrificación) y azufre (respiración de sulfato/compuestos de azufre). Se concluye que, si bien T. harzianumI TEM 3636 no alteró drásticamente la estructura bacteriana dominante, sí moduló selectivamente el potencial funcional del microbioma, particularmente en vías relevantes para la disponibilidad de nutrientesItem Open Access
Análisis genómico y transcriptómico de cepas del género Acidithiobacillus implicadas en la biolixiviación de metales pesados(PUCE - Quito, 2025) Pavón Catani, Alexis David; Cervantes Pérez, Sergio AlanEste trabajo integró análisis genómicos y transcriptómicos de cepas de Acidithiobacillus con el objetivo de comprender los mecanismos moleculares que sostienen su capacidad de biolixiviar minerales metálicos. En primer lugar, el análisis genómico comparativo de A. ferrooxidans, A. thiooxidans, A. ferrivorans y A. caldus permitió identificar genes y operones clave implicados en rutas centrales de biolixiviación, como los asociados a la oxidación de hierro (rus operón, cyc2), a la oxidación de compuestos reducidos de azufre (sqr, sox, tetH), y a sistemas de tolerancia a metales pesados y condiciones extremas (copA, merA, arsC, entre otros). Estos hallazgos se enriquecieron mediante búsquedas de ortólogos con OrthoFinder, las cuales evidenciaron genes presentes en las cuatro especies, así como duplicaciones y ausencias específicas que sugieren trayectorias evolutivas divergentes y posibles adaptaciones ecológicas. Posteriormente, el análisis transcriptómico se enfocó en la comparación de la expresión génica bajo condiciones contrastantes, con especial énfasis en A. ferrivorans. Se observó regulación diferencial de genes clave en rutas de oxidación de azufre y hierro, mecanismos de estrés frente a pH extremadamente ácido y presencia de metales pesados, así como en la formación de biopelículas. Estos patrones sugieren adaptaciones moleculares que favorecen la eficiencia de la biolixiviación en distintos ambientes, particularmente en relación con la temperatura y disponibilidad de nutrientes. En conjunto, los resultados proporcionan un panorama integral: el análisis genómico define el repertorio de genes y su conservación evolutiva entre especies, mientras que el transcriptómico revela su activación diferencial frente a condiciones específicas. Esta doble aproximación contribuye al entendimiento del papel de Acidithiobacillus en la solubilización de metales y abre la posibilidad de diseñar estrategias más informadas para la optimización de procesos de biolixiviación. No obstante, se reconocen limitaciones asociadas al número de cepas estudiadas, la dependencia de datos públicos y la necesidad de validar experimentalmente los hallazgos. Futuras investigaciones podrán integrar otras aproximaciones ómicas (proteómica, metabolómica) para alcanzar una visión aún más completa del metabolismo y regulación de estas bacterias.Item Open Access
Caracterización de la diversidad genética de deleciones e inserciones en los genomas de SARS CoV-2 en Ecuador y su relación con el fitness viral entre octubre de 2023 y septiembre de 2024(PUCE - Quito, 2025) García Cando, Daniela Sofía; Cervantes Pérez, Sergio AlanEl monitoreo epidemiológico de SARS CoV-2con secuenciación es indispensable actualmente, ya que permite identificar de manera oportuna variantes que pueden ser de interés por su impacto epidemiológico. Como consecuencia de este cambio de enfoque actualmente se cuenta con una gran cantidad de información genómica cuya interpretación es fundamental para que las instituciones de salud y gobiernos puedan tomar decisiones informada ssobre el control y contención del virus. En este contexto, el análisis secundario, es decir el llamado de variantes genómicas es importante pues implica hacer que esta información sea accionable al identificar eventos genéticos que puedan impactar el fitness viral aumentando la transmisibilidad, patogenicidad y disminuyendo la eficiencia de los tratamientos disponibles. Si bien dentro de estos eventos genéticos, las sustituciones de nucleótidos han sido muy estudiadas, este no ha sido el caso para inserciones y deleciones. Razón por la que en este estudio se pretende identificar eventos de deleción e inserción que tengan un impacto positivo en el fitness viral. Esto dentro de cerca de 800 secuencias del virus del SARS CoV-2 en Ecuador que se descargaron del GISAID. También se incluyó más de 1000 secuencias de Colombia, México y Brasil, para contar con un panorama más amplio sobre el comportamiento del virus en la región y con diferentes presiones ambientales dentro del periodo de octubre de 2023 a septiembre de 2024.Esto mediante el uso de herramientas bioinformáticas como NextClade de NextStrain, ancladas en la nube y realizando gráficos y clasificación de datos en Excel, y pruebas estadísticas en RItem Open Access
Comparación de dos métodos para analizar single-cell transcriptomics en plantas(PUCE - Quito, 2023) Quevedo Tumailli, Viviana Fernanda; Cervantes Pérez, Sergio AlanLa secuenciación de ARN en el campo de la investigación genética, ha permitido comprender, entre muchas cosas, la función de los genes, la regulación génica, la expresión de los genes y los mecanismos de biología molecular. La expresión génica en plantas de la especie Arabidopsis thaliana permite estudiar los genes que se activan o desactivan para producir proteínas y otras moléculas que son esenciales para el crecimiento, desarrollo y respuesta a su entorno. Sin embargo, a pesar de contar con una gran cantidad de datos de expresión génica en bases de datos de libre acceso, la limitante común es la falta de profundidad en la comprensión de la expresión génica. El estudio de la expresión génica se ha realizado en las últimas décadas mediante microarreglos de ARN y luego mediante secuenciación de ARN para órganos o tejidos pero no con la resolución del nivel celular. La transcriptómica unicelular permite un análisis más detallado en comparación con la transcriptómica a gran escala, permitiendo analizar las diferencias en la expresión génica entre las células individuales. Uno de los métodos más utilizados para la transcriptómica unicelular es el Método de Protoplastos, que implica la degradación enzimática de la membrana celular, pero se ha visto limitada por la rigidez de la pared celular y el uso de tratamientos enzimáticos agresivos, como alternativa se encuentra el método llamado aislamiento de núcleos que permite separar y extraer los núcleos celulares directamente. En este sentido, se desconoce el impacto de los métodos utilizados en los resultados de transcriptómica unicelular en plantas. En este trabajo, la idea fue comparar la transcriptómica unicelular en condiciones similares de estos 2 métodos mencionados para evaluar las diferencias. Se usaron 5 muestras descargadas de la base de datos GSE155304 del NCBI, 2 muestras pr1 y pr2 para el Método Protoplastos y 3 muestras mr1, mr2 y mr3 para el aislamiento de núcleos con un promedio de células de 4316 y 3198 respectivamente.El presente trabajo ha permitido estudiar diferentes Métodos entre Protoplastos y aislamiento de núcleos para transcriptómica unicelular en plantas. Los conjuntos de datos procesados dan como resultado datos más refinados y de mayor calidad. En los dos métodos se observó una fuerte correlación entre el número de genes y el número de moléculas IMU, ya que los datos son consistentes y confiables. Se observó agrupaciones celulares similares en los métodos individuales, pero diferencias notables al integrar los datos de ambos métodos. El método UMAP se utilizó para reducir la dimensionalidad de los datos y el método de agrupación de Lovaina para identificar agrupaciones de interés. Ambos métodos mostraron resultados muy similares y confiables, por lo que la recomendación sería utilizar el método que más se adecue al tejido/planta de interés.Item Open Access
Comparación genómica y evolutiva de Trypanosoma cruzi y Trypanosoma rangeli para evaluar su impacto en la patogenicidad(PUCE - Quito, 2025) Rueda Vera, Adriana Elizabeth; Cervantes Pérez, Sergio AlanLa diferencia en la patogenicidad entre Trypanosoma cruzi y Trypanosoma rangeli constituye un punto clave en parasitología ya que permite comprender por qué una de estas especies es altamente patógena para el ser humano mientras que la otra se considera no patogénica. Explorar estas diferencias resulta fundamental para dilucidar los factores moleculares que determinan la capacidad de invasión y la interacción con el sistema inmune. En este contexto, las familias génicas que codifican proteínas de superficie como AMASTIN y DGF-1, adquieren un papel central, al estar directamente asociadas con los mecanismos de adhesión, invasión de células hospedadoras y evasión de la respuesta inmune. Sin embargo, su historia evolutiva y expansión en ambas especies permanecen aún poco comprendidas. El objetivo principal de esta investigación fue analizar la expansión de las familias génicas AMASTIN y DGF-1 en T. cruzi y T. rangeli y su posible relación con la patogenicidad diferencial entre ambas especies a lo largo de su historia evolutiva. Para ello, se seleccionaron genomas completos de ambas especies, incorporando a Trypanosoma brucei como grupo externo. Los datos genómicos y sus anotaciones se obtuvieron de NCBI GenBank y se procesaron en un entorno bioinformático basado en Linux, utilizando Python, ClustalW, IQ-TREE2 y HMMER, entre otras herramientas, para la extracción de secuencias, alineamientos múltiples, construcción de árboles filogenéticos e identificación de dominios conservados. Los resultados mostraron que Trypanosoma cruzi presentó una expansión significativa de ambas familias génicas (AMASTIN: hasta 39 copias; DGF-1: >1000 copias en algunas cepas) con alta conservación secuencial y una organización estructurada de dominios. En contraste, T. rangeli exhibió números reducidos de copias (AMASTIN 8; DGF-1 18) y una mayor variabilidad estructural. El análisis filogenético confirmó que las familias de proteínas AMASTIN y DGF-1 en T. cruzi y T. rangeli forman clados monofiléticos, respaldando un ancestro común dentro del subgénero Schizotrypanum, seguido de eventos de expansión específicos por especie. T. brucei careció de DGF-1 y retuvo solo una copia de AMASTIN. Dado que los genomas analizados provienen de diferentes tecnologías de secuenciación y presentan variaciones en su calidad de ensamblaje y anotación, los números absolutos de genes deben interpretarse con cautela. No obstante, la expansión masiva y conservación de AMASTIN y DGF-1 en T. cruzi sugieren una fuerte presión adaptativa relacionada con su estilo de vida intracelular. El reducido número de copias y la mayor variabilidad en T. rangeli reflejan una selección relajada, consistente con su ecología no patógena. Estos resultados destacan el papel de la evolución de familias génicas en la configuración de la virulencia y adaptación al hospedero en tripanosomátidos.Item Open Access
Comprendiendo la diversidad genética de Glycine maxa nivel de célula única(PUCE - Quito, 2025) Rojas Chango, Mélida Guadalupe; Cervantes Pérez, Sergio AlanLa soya, Glycine max, es un cultivo de importancia alimenticia para el ser humano y para los animales de granja. Además, la soya se cultiva para propósitos degeneración de biocombustibles lo que vuelve a este cultivo de uso versátil y de gran peso en la industria agroalimentaria. Es necesario entonces desarrollar planes de fitomejoramiento que permitan aprovechar de mejor manera el cultivo aumentando su productividad. Además, es importante concentrarse en mejoras de resistencia ante patógenos y formas de volver resiliente al cultivo en frente del cambio climático y sus múltiples consecuencias. Con estos antecedentes el presente estudio buscó comprender la expresión genética de genes de soya con variación estructural, genes asociados a resistencia a Phythophthora sojae y genes asociados al estrés hídrico. Para este propósito se intersecó datos de un pangenoma de soja de 26 genomas, una lista de genes asociados a resistencia a P. sojae y genes asociados a estrés hídricos con los datos pertenecientes a expresión génica de secuenciación de célula única expuestos en Tabula Glycine. Se encontró que los genes con variaciones estructurales se expresan altamente en células de tejido de semilla y raíz y meristemo floral, y los genes de resistencia y genes asociados a productividad se expresan en mayor medida en tejidos como haz vascular, hoja verdadera, semilla y cotiledónItem Open Access
Integración de Herramientas Computacionales para el Desarrollo de Estrategias para el Control del Mal de Panamá (Fusarium oxysporum f. sp. cubense Raza Tropical 4) en Banano (Musa AAA)(PUCE - Quito, 2025) Aguirre Saltos, Milena Belén; Cervantes Pérez, Sergio AlanLa enfermedad del Mal de Panamá, causada por Fusarium oxysporum f. sp. cubense (Foc) TR4, representa una de las mayores amenazas para la producción de banano (Musa AAA) a nivel mundial. En este estudio, se integraron herramientas computacionales para identificar regiones de interacción hospedero-patógeno y péptidos candidatos con potencial actividad antimicrobiana, con el objetivo de contribuir al desarrollo de estrategias sostenibles de control. Se realizaron alineamientos bidireccionales BLASTn y BLASTp entre los genomas y proteomas de Musa acuminata AAA y F. oxysporum TR4, aplicando filtros estrictos de alineamiento (% de identidad ≥ 70 % para BLASTn; ≥ 60 % para BLASTp y E-value ≤ 0,001 para ambos). El análisis permitió identificar 8627 coincidencias a nivel genómico y 3751 a nivel proteico, de las cuales se seleccionaron 143 péptidos de longitud ≤ 100 aminoácidos. La predicción del potencial antimicrobiano mediante CAMPR4 clasificó 12 péptidos de banano, destacando (XP_065019639.1_2, XP_065039134.1, XP_065036054.1 y XP_064979954.1, con probabilidad ≥ 0,73) y 2 de Fusarium (TXC09145.1 y TXC09145.1_2, con probabilidad ≥ 0,60) como potenciales antimicrobianos. La evaluación del potencial codificante mediante CPC2 mostró que la mayoría de las secuencias no poseen características típicas de transcritos codificantes, aunque sí presentan estructuras peptídicas relevantes. La anotación funcional reveló que muchos péptidos están asociados a proteínas ribosomales y polimerasas, fundamentales en procesos celulares críticos. Además, se identificaron péptidos asociados a membrana plasmática en Fusarium, proponiéndose su bloqueo como una estrategia potencial para comprometer la viabilidad del patógeno. La predicción estructural 3D mediante AlphaFold confirmó la presencia de motivos estructurales típicos de péptidos antimicrobianos. Estos resultados respaldan el uso de aproximaciones in silico para la selección de péptidos candidatos y sientan las bases para futuras estrategias de biocontrol molecular del Mal de Panamá en banano.Item Open Access
Pangenoma de cepas de Pseudomonas aeruginosa presentes en hospitales de Quito, Ecuador(PUCE - Quito, 2024) Morales Caiza, Gabriela Nathaly; Cervantes Pérez, Sergio AlanDurante las últimas décadas en los estudios genómicos se ha usado el genoma de referencia como base de comparación, principalmente por el alto costo de secuenciación. Sin embargo, este genoma tiene ciertas limitaciones, al no ser el más común entre la especie y provenir de individuos de una ubicación geográfica específica, no representa la diversidad genética real y esto conlleva a una interpretación imprecisa de las variantes genéticas. Con el fin de solventar estas limitaciones se han desarrollado nuevas estrategias y una de ellas es el desarrollo de los pangenomas. El pangenoma es el conjunto de múltiples genomas donde se presenta un genoma central constituido por los genes consenso entre todas las secuencias y un genoma no esencial constituido por las secuencias únicas de cada individuo. Especies bacterianas como Pseudomonas aeruginosa poseen mecanismos de resistencia mediados por modificaciones genéticas, haciendo que estos patógenos sean altamente infecciosos y por lo tanto constituyen un problema de salud pública. Conocer a fondo estas modificaciones ayuda al desarrollo de nuevas dianas terapéuticas. En este proyecto se obtuvo el pangenoma de 42 secuencias de P. aeruginosa, extraídas de NCBI (Acceso: PRJNA946810), se usaron dos programas bioinformaticos, Pankmers y Anvi’o, ambos basados en Python.Item Open Access
Uso de filogenómica para la identificación de proteínas asociadas a la ruta biosintética de alcaloides anticancerígenos en plantas(PUCE - Quito, 2023) Rodríguez Pazmiño, Ángel Sebastián; Cervantes Pérez, Sergio AlanVinblastina y vincristina son anticancerígenos de gran importancia para la industria farmacéutica. Actualmente su proceso de obtención es altamente complejo y costoso debido, por una parte, a la baja concentración en la planta Catharanthus roseus, siendo este el único organismo en el cual se han encontrado. Por ello, se han intentado diversas estrategias biotecnológicas para inducir una mayor producción de estos fármacos a un menor costo. En este trabajo, utilizando criterios filogenómicos y diferentes herramientas bioinformáticas, se explora la potencial presencia de los alcaloides vinblastina y vincristina en un grupo de 72 plantas, usando como secuencias de referencia cuatro proteínas asociadas a la ruta de biosíntesis de estos alcaloides en la planta Catharanthus roseus. Un enfoque de investigación como el propuesto en este proyecto, podría sugerir su presencia en una especie de planta distinta; impulsando, posteriormente, investigaciones de “wet lab” que confirmen o descarten su existencia.
