Galemys: Alineamiento, ensamblado y secuenciación del genoma del desmán de los Pirineos

Printer-friendly versionVersión en PDF
Researchers: 
  • Juan Luis García Zapata, Universidad de Extremadura (UEx).
Objectives: 

Se propone realizar la secuenciación, alineamiento y construcción de una base de datos genómica a partir de extracción de ADN completo del Desmán de los Pirineos (Galemys pyrenaicus), así como desarrollar la infraestructura bioinformática necesaria para su comparativa con otros genomas pertenecientes a especies de micromamíferos, aplicando metodologías de Deep Learning y Aprendizaje por Refuerzo.

Las técnicas genómicas de construcción de la base de datos, de procesamiento y comparación demandan tanto gran capacidad de almacenamiento como gran capacidad de cómputo, tanto por volumen de datos como por el uso de algoritmos estadísticos y combinatorios específicos de este campo, lo que implica el uso de instalaciones de altas prestaciones (High performance computing, HPC), así como metodologías de computación científica específicas en el campo de la bioinformática.

Se cuenta con el apoyo de un equipo de investigadores que ha sido integrante de diversas colaboraciones con la Administración para usar métodos moleculares para la identificación de la especie desmán, evaluación de su variabilidad genética e identificación individual, incluyendo la diferenciación de otras especies insectívoras que comparten hábitat. Otra parte del equipo proponente, de base tecnológica, aporta experiencia en computación científica así como también en el análisis para optimización del rendimiento de plataformas HPC y el uso de GPU (graphics processing unit) en aprendizaje profundo y otras técnicas de inteligencia artificial. En particular para el proyecto se pretende no solo el estudio del genoma del desmán junto con el desarrollo de pipelines de análisis genómico de esta especie, sino también la aplicación de herramientas basadas en técnicas de Deep Learning en la comparativa de genomas, que hasta ahora venía haciéndose mediante métodos estadísticos clásicos.

Journals and conferences: 
  • “Analytical communication performance models as a metric in the partitioning of data-parallel kernels on heterogeneous platforms”. Juan A. Rico-Gallego, Juan Carlos Díaz Martín, Carmen Calvo-Jurado, Sergio Moreno-Álvarez, and Juan-Luis García Zapata. The Journal of Supercomputing, 75(3):1654–1669, 2019.
  • “Clustering Vertex-Weighted Graphs by Spectral Methods”. Juan-Luis García-Zapata, Clara Grácio. Mathematics 2021, 9(22), 2841.
  • "Calero-Bernal R, Santín M, Maloney JG, Martín-Pérez M, Habela MA, Fernández-García JL, Figueiredo A, Nájera F, Palacios MJ, Mateo M, Balseiro A, Barral M, Lima-Barberoi JF, Köster PC, Carmena D. Blastocystis sp. Subtype Diversity in Wild Carnivore Species from Spain. J Eukaryot Microbiol. 2020 Mar;67(2):273-278. doi: 10.1111/jeu.12772. Epub 2019 Nov 26. PMID: 31691450.