
El CNAG cartografía el conjunto más completo de dominios proteicos en retrovirus endógenos humanos
Investigadores del Centro Nacional de Análisis Genómico (CNAG), con sede en el Parque Científico de Barcelona, han analizado un amplio conjunto de 120.000 marcos de lectura abiertos (ORFs) derivados de retrovirus endógenos humanos (HERVs) y han identificado 17.540 dominios proteicos retrovirales. El estudio, publicado en la revista NAR Genomics and Bioinformatics, abre la puerta a nuevas investigaciones sobre cómo se expresan las proteínas HERV, cómo influyen en el sistema inmunitario y cómo el genoma las ha reutilizado en salud y enfermedad.
En los seres humanos, casi el 8% de nuestro ADN está compuesto por retrovirus endógenos humanos (HERVs), restos de antiguas infecciones víricas transmitidas de generación en generación. A menudo se los denomina “fósiles genómicos”, porque aunque la mayoría han perdido su capacidad de actuar como virus, siguen integrados en nuestro genoma. Aunque muchos HERVs están fragmentados o mutados, algunos aún conservan elementos funcionales que pueden influir en la regulación génica, la producción de proteínas y otros procesos celulares.
Hasta ahora se sabía poco sobre su potencial para codificar proteínas. Para comprender mejor este papel, el Equipo de Genómica Funcional del CNAG, liderado por la Dra. Anna Esteve-Codina, junto con el investigador Tomàs Montserrat-Ayuso y en colaboración con la Dra. Aurora Pujol del Institut d’Investigació Biomèdica de Bellvitge (IDIBELL), ha generado el mapa más completo hasta la fecha de los dominios proteicos presentes en las secuencias HERV.
El extenso conjunto de datos, analiza más de 120.000 marcos de lectura abiertos (ORFs), secuencias de ADN derivadas de HERVs. Mediante una pipeline reproducible a gran escala basada en HMMER e InterProScan, los investigadores identificaron 17.540 coincidencias de dominios proteicos en estas secuencias, la mayoría correspondientes a partes del gen viral pol, como la transcriptasa inversa, la RNasa H y la proteasa. Estos componentes eran esenciales para copiar el material genético del virus e integrarlo en el genoma del huésped. De forma notable, miles de estos dominios permanecen altamente conservados, y cerca de 1.000 presentan más del 95% de cobertura de alineamiento, lo que indica que muchas regiones proteicas virales antiguas siguen prácticamente intactas.
“Las proteínas derivadas de los HERVs son más que simples fósiles genómicos; muchas conservan características estructurales que apuntan a funciones residuales o reutilizadas. Sabemos que algunas desempeñan hoy papeles importantes: desde apoyar el desarrollo de la placenta hasta contribuir a enfermedades neurodegenerativas e inflamatorias como la esclerosis múltiple o el Alzheimer. Aun así, queda mucho por descubrir sobre su impacto completo. Nuestro nuevo conjunto de datos ofrece un mapa exhaustivo de estos antiguos elementos virales, permitiendo a los investigadores explorar sus funciones en todo el genoma humano”, explica la Dra. Anna Esteve, autora correspondiente del estudio.
El estudio subraya patrones distintos de preservación entre las subfamilias de HERVs. Algunas, como HERVK (HML-2), destacan por conservar múltiples ubicaciones en el genoma con proteínas virales casi completas. Entre ellas se incluyen Gag, que forma la cápside protectora del virus; Pol, que contiene enzimas clave como la transcriptasa inversa, la RNasa H y la proteasa; y Env, la proteína de envoltura que permite al virus entrar en las células, con regiones transmembrana que la anclan a las membranas. Otras subfamilias muestran patrones diferentes: HERVH tiende a conservar los dominios enzimáticos de Pol, mientras que HERVE preserva sorprendentemente regiones de proteasa y transcriptasa inversa. En conjunto, tanto las familias de HERV más jóvenes como las más antiguas mantienen fragmentos funcionales, ofreciendo una visión de cómo estos restos virales pueden seguir influyendo en la actividad génica y en procesos celulares actuales.
El conjunto de datos y el código utilizados para los análisis en este estudio se han publicado como recurso de acceso abierto en Zenodo, con el fin de facilitar nuevas investigaciones sobre las proteínas HERV, su papel en la regulación génica, las respuestas inmunitarias y sus posibles contribuciones a la salud y la enfermedad humanas.
» Artículo de referencia: Montserrat-Ayuso, Tomàs, et al. ‘A Comprehensive Annotation of Conserved Protein Domains in Human Endogenous Retroviruses’. NAR Genomics and Bioinformatics, vol. 8, no. 1, Jan. 2026, p. lqag013. DOI.org (Crossref). DOI: 10.1093/nargab/lqag013.
» Acceso a la noticia: web del CNAG [+]



