
L’IRB Barcelona coordina un estudi amb més d’un centenar d’experts per la creació d’una base de dades FAIR de les simulacions moleculars
L’IRB Barcelona, amb seu al Parc Científic de Barcelona, ha coordinat la publicació d’un estudi amb més d’un centenar d’experts en simulació molecular advocant per un canvi de paradigma en la gestió de dades de dinàmiques moleculars. L’article, publicat a la revista Nature Methods, defensa la implementació de principis FAIR (“Findable, Accessible, Interoperable, Reusable”) per millorar la reproductibilitat dels càlculs i facilitar-ne l’ús posterior com a font d’informació sobre la flexibilitat de les biomacromolècules. El treball, liderat pel Dr. Modesto Orozco i el Dr. Adam Hospital proposa crear una infraestructura comuna per emmagatzemar i reutilitzar dades en el context de la revolució de la IA.
A diferència de la biologia estructural o la genòmica, on guardar i compartir dades sota estàndards comuns és pràctica comuna, en el camp de la simulació molecular aquestes dades segueixen fragmentades i sovint acaben oblidades en ordinadors personals, cosa que dificulta la reproductibilitat dels càlculs, i n’impossibilita l’aprofitament posterior.
Això genera un problema formidable per a la integració d’aquestes dades en els fluxos de treball de la biologia estructural i de la biofísica i frena el desenvolupament de mètodes d’intel·ligència artificial, l’entrenament dels quals és extremadament dependent de l’accés d’ingents quantitats de dades dinàmiques.
A l’article publicat a la revista Nature Methods, més de 100 investigadors alerten d’aquesta situació i reclamen un canvi de model: aplicar els principis FAIR —que garanteixen que les dades siguin localitzables, accessibles, interoperables i reutilitzables— als resultats de simulacions. L’article ha estat signat per especialistes de referència internacional, incloent-hi dos premis Nobel i figures referents dels millors centres de recerca del món. L’objectiu proposat és construir un ecosistema obert i sostenible que multipliqui l’impacte d’aquestes dades i eviti duplicitats innecessàries.
“Reutilitzar en lloc de repetir”
“La comunitat ha assumit durant anys que repetir una simulació era més fàcil i barat que arxivar-la. Però això ja no és cert”, afirma el Dr. Modesto Orozco, coordinador del projecte Europeu Molecular Dynamics Data Bank (MDDB), cap del laboratori de Modelització Molecular i Bioinformàtica de l’IRB Barcelona, Catedràtic de la Universitat de Barcelona i fundador de l’empresa biotecnològica Nostrum Biodiscovery.
“El coneixement que podem extreure en reutilitzar dades és enorme: ens permetrà identificar noves dianes, entrenar algorismes d’intel·ligència artificial o dissenyar nous experiments”, afegeix el Dr. Adam Hospital. Tots dos lideren el projecte europeu MDDB, finançat pel programa Horizon Europe de la Comissió Europea, que busca precisament establir una base de dades centralitzada i accessible per a simulacions moleculars.
Lliçons d’altres camps
La proposta s’inspira en l’èxit d’altres àrees que han apostat per la ciència oberta. El Protein Data Bank, que des dels anys setanta recull estructures tridimensionals de biomacromolècules i que ha estat fonamental, no només per revelar el funcionament de proteïnes i àcids nucleics, per permetre la revolució “òmica” o per guanyar una visió holística de la cèl·lula, sinó que ha estat instrumental en el desenvolupament de fàrmacs.
Les dades emmagatzemades han estat clau per a l’entrenament d’AlphaFold2, reconegut amb el Premi Nobel de Química 2024. Els autors sostenen que complementar aquestes dades estructurals amb informació dinàmica obrirà un nou camp, la potencialitat del qual de desenvolupament és difícil sobreestimar.
Segons els autors de l’article, ha arribat el moment que la comunitat de simulació molecular adopti pràctiques similars a les de les comunitats estructurals i “òmiques”, no només conservant les dades, sinó també estandarditzant els formats d’arxiu, les metadades i els criteris de qualitat. El text descriu com una infraestructura federada, amb nodes distribuïts i eines d’accés comú, podria fer viable aquest fitxer d’escala planetària.
Més enllà de l’emmagatzematge
L’enfocament defensat a l’article publicat a Nature Methods no es limita a desar dades. Es defensa un model integrat: des de la documentació precisa de les simulacions (condicions, programari, paràmetres, etc.) fins a la seva anàlisi automatitzada, validació i reutilització mitjançant tècniques d’aprenentatge automàtic. “El valor d’aquestes dades no acaba amb la publicació d’un article, o amb la presentació d’aquestes dades en un congrés. Sovint això només és el principi”, conclou el Dr. Orozco. “Les dades les hem de tractar com un bé comú de la ciència”.
» Article de referència: The need to implement FAIR principles in biomolecular simulations. Rommie E. Amaro, Johan Åqvist, (…) Adam Hospital, Modesto Orozco et al. Nature Methods (2025) doi: 10.1038/s41592-025-02635-0
» Enllaç a la notícia: web de l’IRB Barcelona [+]