Skip to main content
Sin categorizar

Investigadores del CNAG y CRG avanzan en el análisis de datos del genoma

By 31 de octubre de 2012noviembre 16th, 2020No Comments
< Volver a noticias
Los resultados del trabajo se publican en la revista Nature Methods. © CNAG.
 31.10.2012

Investigadores del CNAG y CRG avanzan en el análisis de datos del genoma

El equipo de científicos del proyecto GEM, liderado por Paolo Ribeca del Centro Nacional de Análisis Genómico (CNAG) –con sede en el Parc Científic de Barcelona– y en el que también participan científicos del Centro de Regulación Genómica (CRG), han desarrollado una herramienta para la interpretación de datos genómicos mucho más rápida y exacta que otras que se utilizan actualmente: el software GEM (Genomic Multitool). Los resultados del trabajo, alcanzados tras cinco años de esfuerzos, se publican en la revista Nature Methods.

»


El aumento exponencial en la capacidad de secuenciación, ha convertido en esenciales las herramientas para el análisis de datos para poder procesar la gran cantidad de datos biológicos. Este es el punto de partida que llevó a algunos investigadores del CRG y CNAG, al diseño de un programa informático que ayuda a encontrar las secuencias, de forma rápida y precisa, en el genoma de referencia. Estas herramientas, llamadas «mappers», son esenciales para interpretar los datos de los estudios genómicos , pues son el primer paso en el análisis de muchos experimentos biológicos. Después de 5 años de desarrollo, el resultado es el GEM (Genomic Multitool) mapper.

El mapper GEM es varias veces más rápido que otros programas utilizados en este tipo de investigaciones y ofrece un gran rendimiento, siendo capaz de igualar acoplando unos 40 millones de secuencias por hora utilizando una CPU de núcleo único. Al utilizar algoritmos que garantizan que no se produzcan emparejamientos erróneos, GEM es mucho más preciso que otros programas similares. Además, GEM permite ajustar los parámetros de búsqueda a los requisitos específicos de cada experimento biológico, y ofrece una versatilidad que no se puede lograr con otras herramientas.

Este excelente desempeño de GEM es clave para hacer frente a un problema práctico: el increíble aumento en la cantidad de datos de secuenciación. A modo de ejemplo, el CNAG inició sus operaciones en 2010 con un equipamiento de 12 secuenciadores de segunda generación, que generaban unas 50 gigabases por día. Gracias a los recientes avances en la tecnología de secuenciación, en la actualidad, sólo 2 años y medio después, el CNAG genera casi 20 veces más datos con el mismo número de máquinas de secuenciación. Sin embargo, habría sido imposible aumentar los recursos informáticos de la CNAG al mismo ritmo (y este es un problema común para la investigación biomédica en todo el mundo). Por lo tanto, el desarrollo de herramientas de análisis más eficientes como GEM es esencial para mantenerse al día con esta creciente tasa de producción.

La investigación fue financiada por el Ministerio español de Educación y Ciencia (Programa Consolider), por los Institutos Nacionales de la Salud de EE.UU, el National Human Genome Research Institute, y por la Unión Europea (READNA y programas ESGI).