Ensamblaje y anotación del genoma de una proteobacteria perteneciente a la familia Orbaceae a partir de datos metagenómicos del tracto digestivo de la mosca soldado negra Hermetia illucens

Loading...
Thumbnail Image
Date
2023
Journal Title
Journal ISSN
Volume Title
Publisher
PUCE - Quito
Abstract
El objetivo de este trabajo fue ensamblar y anotar el genoma de una proteobacteria perteneciente a la familia Orbaceae, a partir de datos metagenómicos del tracto digestivo de Hermetia illucens en estado larvario y conocer qué genes y rutas metabólicas de esta bacteria están involucrados en el proceso de biotransformación de residuos. El trabajo se dividió en tres etapas: la primera fue la eliminación de las lecturas del hospedero, la segunda consistió en el ensamblaje y anotación del metagenoma y la tercera en la búsqueda de genes y rutas metabólicas en el genoma de interés. La primera etapa inició con un control de calidad con la herramienta FASTQC, para continuar con la limpieza de las secuencias con trimmommatic y la re-evaluación de su calidad. Los resultados indicaron que, el 5,07 % de las lecturas fueron eliminadas por su baja calidad. Luego se eliminaron las lecturas duplicadas (11,76 %) con el paquete BBMap. De los 17 677 745 de lecturas paired end restantes, el 59,69 % se alinearon y mapearon sobre el genoma de referencia del hospedero con la herramienta Bowtie2. Samtools permitió obtener un archivo .bam con las lecturas no mapeadas al genoma de referencia. Posteriormente, las lecturas se dividieron en dos archivos (forward y reverse), en formato FASTQ, con ayuda de la herramienta bedtools. La segunda etapa inició con una predicción de la composición microbiana con Kaiju, para para su posterior comparación con árboles de especie generados luego del ensamblaje y anotación del metagenoma. Con esta herramienta se encontró que los microorganismos más abundantes pertenecieron a los filos Firmicutes, Proteobacteria, Bacteroidetes y Actinobacteria. Así mismo las especies con abundancia relativa alta fueron, Hungatella hathewayi, Frischella perrara, Gilliamella apícola, Enterococcus sp., Providencia rettgeri, entre otras. Para el ensamblaje del metagenoma se utilizaron tres herramientas: metaSPAdes, IDBA-UD y MEGAHIT, cuyos resultados fueron comparados con Compare Assembled Contig Distributions. La herramienta que permitió un mejor ensamblaje fue metaSPAdes cuyo contig más largo fue de 706 116 pb y un N50 de 22 421 pb. Posteriormente, los contigs metagenómicos ensamblados fueron agrupados en bins con las herramientas MaxBin2, MetaBAT2 y CONCOCT, luego de lo cual se procedió a su optimización con DASTool, obteniéndose un porcentaje de agrupamiento del 38,52 % en 10 bins de alta calidad (BinScore > 0.7). La evaluación de la calidad de los bins se llevó a cabo con la herramienta CheckM, donde se encontró que el bin 007 pertenecía a una gammaproteobacteria y con base en conjuntos de genes marcadores que están presentes en una sola copia se determinó una integridad del 99,44 % (número de conjuntos de marcadores presentes con respecto a los conjuntos de marcadores de referencia) y una contaminación del 0,05 % (número de genes marcadores que están presentes en varias copias en cada conjunto de marcadores). La anotación se llevó a cabo con Annotate Multiple Microbial Assemblies with RASTtk (AMMA with RASTtk), donde el bin 007 fue asignado al género Orbus y tuvo una longitud total de 3 084 216 pb, con 2 881 genes, de los cuales el 97,29 % fueron codificantes. La clasificación taxonómica con Genome Taxonomic Database (GTDB)-Tk reportó los mismos resultados que con AMMA with RASTtk. Posteriormente, se construyó un árbol de especies con Species tree que indicó que los microorganismos más cercanos encontrados para el bin 007 fueron de los géneros Frischella y Gilliamella, lo cual concuerda con los resultados obtenidos tanto en Kaiju, como en AMMA with RASTtk y (GTDB)-Tk, indicando que el bin 007 corresponde a Orbus sp. IPMB12 y al género Orbus, respectivamente; motivo por el cual se pudo asegurar que la bacteria pertenece a la familia Orbaceae. Adicionalmente, se realizó otro árbol filogenético con la herramienta Bacterial Genome Tree donde se estableció que el genoma posiblemente corresponde a una especie aún no caracterizada del género Orbus. La tercera etapa inició con la herramienta DRAM que proporcionó un resumen del perfil funcional o metabólico del genoma anotado. La presencia de rutas metabólicas y funciones vinculadas con la utilización de carbono, nitrógeno, celulosa amorfa y producción de alcohol se relacionó con la eficacia de degradación de residuos orgánicos por parte de esta bacteria en los intestinos de H. illucens, contribuyendo en la bioconversión de residuos con un metabolismo anaeróbico facultativo. Posteriormente, se utilizó Build FeatureSet from Genome y Merge FeatureSets para construir un conjunto de características con genes pertenecientes a PET hidrolasas. Con MUSCLE y Gblocks se generó una alineación de secuencias múltiple de secuencias de proteínas recortada para eliminar regiones variantes. Por último, se usó HMMERsearch from MSA cuyo informe indicó que, no se encontraron genes pertenecientes a las PETasas pero no se descartó la posibilidad de que existan otras enzimas relacionadas con la degradación de PET.
Description
Keywords
Hermetia illucens, Dípteros, Moscas, Metagenómica, Aparato digestivo, Genomas, Proteobacterias, Biología computacional
Citation