Skip to main content
< Tornar a notícies
La Dra. Anna Esteve-Codina amb l'investigador Tomàs Montserrat-Ayuso. Foto / CNAG
 02.03.2026

El CNAG cartografia el conjunt més complet de dominis proteics en retrovirus endògens humans

Investigadors del Centre Nacional d’Anàlisi Genómica (CNAG), amb seu al Parc Científic de Barcelona, han analitzat un vast conjunt de 120.000 marcs de lectura oberts (ORFs) derivats de retrovirus endògens humans (HERVs) i han identificat 17.540 dominis proteics retrovirals. L’estudi, publicat a la revista, NAR Genomics and Bioinformatics, obre la porta a noves investigacions sobre com s’expressen les proteïnes HERV, com influeixen en el sistema immunitari i com el genoma les ha reaprofitat en salut i malaltia.

En els humans, gairebé un 8% del nostre ADN està format per retrovirus endògens humans (HERVs), restes d’antigues infeccions víriques que s’han transmès de generació en generació. Sovint es fa referència a aquestes seqüències com a “fòssils genòmics” perquè, encara que la majoria han perdut la capacitat d’actuar com a virus, romanen incrustades en el nostre genoma. Tot i que molts HERVs estan fragmentats o mutats, alguns encara contenen elements funcionals que poden influir en la regulació gènica, la producció de proteïnes i altres processos cel·lulars.

Fins ara, se sabia poc sobre el seu potencial per codificar proteïnes. Per comprendre millor aquest paper, l’Equip de Genòmica Funcional del CNAG, liderat per la Dra. Anna Esteve-Codina, juntament amb el investigador Tomàs Montserrat-Ayuso i en col·laboració amb la Dra. Aurora Pujol de l’Institut d’Investigació Biomèdica de Bellvitge (IDIBELL), ha generat el mapa més complet fins avui dels dominis proteics dins de seqüències HERV.

El conjunt de dades analitza més de 120.000 marcs de lectura oberts (ORFs), seqüències d’ADN derivades dels HERVs. Mitjançant una pipeline a gran escala i reproduïble basada en HMMER i InterProScan, els investigadors han identificat 17.540 coincidències de dominis proteics en seqüències HERV, la majoria corresponents a parts del gen viral pol, com la transcriptasa inversa, RNasa H i la proteasa. Aquests són components virals essencials que abans permetien copiar el material genètic del virus i integrar-lo al genoma de l’hoste. Sorprenentment, milers d’aquests dominis es mantenen altament conservats, amb prop d’un miler que mostren més d’un 95% de cobertura d’alineament, cosa que indica que moltes regions proteiques virals antigues continuen gairebé completes.

“Les proteïnes derivades dels HERVs són més que simples fòssils genòmics; moltes encara conserven característiques estructurals que suggereixen funcions residuals o reaprofitades. Sabem que algunes d’elles tenen avui un paper important: des de donar suport al desenvolupament de la placenta fins a contribuir a malalties neurodegeneratives i inflamatòries com l’esclerosi múltiple i l’Alzheimer. Tot i això, encara queda molt per descobrir sobre el seu impacte complet. El nostre nou conjunt de dades ofereix un mapa exhaustiu d’aquests elements virals antics, permetent als investigadors explorar les seves funcions a tot el genoma humà”, explica la Dra. Anna Esteve, autora corresponsal de l’estudi.

L’estudi destaca diferents patrons de preservació entre subfamílies d’HERVs. Algunes, com HERVK (HML-2), destaquen per mantenir diversos llocs al genoma amb proteïnes virals gairebé completes. Entre aquestes hi ha Gag, que forma la carcassa protectora del virus; Pol, que porta enzims clau com la transcriptasa inversa, la RNasa H i la proteasa; i Env, la proteïna d’embolcall que permet als virus entrar a les cèl·lules, amb regions transmembrana que l’ancoren a les membranes. Altres subfamílies mostren patrons diferents: HERVH tendeix a conservar els dominis enzimàtics de Pol, mentre que HERVE sorprenentment preserva regions de proteasa i transcriptasa inversa. En conjunt, tant les famílies d’HERV més joves com les més antigues mantenen fragments funcionals, oferint una visió de com aquests remanents virals antics poden continuar influenciant l’activitat gènica i els processos cel·lulars actuals.

El conjunt de dades i el codi utilitzat en les anàlisis d’aquest estudi s’han publicat com a recurs d’accés obert a Zenodo per facilitar futures exploracions de les proteïnes HERV, els seus rols en la regulació gènica, les respostes immunitàries i les possibles contribucions a la salut i la malaltia humanes.

» Article de referència: Montserrat-Ayuso, Tomàs, et al. ‘A Comprehensive Annotation of Conserved Protein Domains in Human Endogenous Retroviruses’. NAR Genomics and Bioinformatics, vol. 8, no. 1, Jan. 2026, p. lqag013. DOI.org (Crossref). DOI: 10.1093/nargab/lqag013.

» Accés a la notícia: web del CNAG [+]