Învățare automată pentru a prezice ce MOF-uri pot fi efectiv realizate în laborator Structurile metal-organice (MOF) sunt printre cele mai reglabile materiale create vreodată — cristale poroase asamblate din noduri metalice și legători organici, cu aplicații de la stocarea gazului până la cataliză. Din punct de vedere computațional, putem genera trilioane de structuri posibile. Problema este că aproape niciuna dintre ele nu este sintetizată. Dintre miile de screening-uri MOF publicate până în prezent, doar aproximativ o duzină au condus la sinteză reală în laborator, iar chiar și atunci, chimiștii tind să aleagă designuri "sigure" care seamănă cu structuri cunoscute, nu cu cele optime din punct de vedere computațional. Andre Niyongabo Rubungo și coautorii abordează acest blocaj cu trei ingrediente: (1) MOFMinE, un set de date nou curatoriat de aproape un milion de MOF-uri cu energii simulate de deformare și energii libere pentru un subset de 65.000 de structuri; (2) MOFSeq, o reprezentare a secvenței care codifică atât caracteristici locale (SMILES ale blocurilor de construcție), cât și caracteristici globale (topologie și conectivitate); și (3) LLM-Prop, un model de limbaj cu 35 de milioane de parametri, preantrenat pe datele abundente de energie de deformație, apoi ajustat fin pe calculele mai costisitoare de energie liberă. Rezultatele sunt remarcabile: o eroare absolută medie de 0,789 kJ/mol, o acuratețe de 97% în prezicerea sintezabilității și o acuratețe de 78% în selectarea polimorfului corect între structurile concurente. Chiar și atunci când două polimorfe diferă cu doar 0,16 kJ/mol, modelul tot alege varianta corectă în mai mult de 60% din cazuri. Implicația este practică: ceea ce odinioară necesita zile întregi de simulare moleculară acum trece înainte printr-o rețea neuronală. Acest lucru deschide o cale pentru filtrarea rutinară a screening-urilor computaționale MOF după sintezabilitatea prezisă — permițând experimentatorilor să pătrundă dincolo de designurile "intuite" în regiuni neexplorate ale spațiului chimic, în timp ce crește șansele ca ceea ce arată bine pe calculator să poată fi realizat în laborator. Hârtie: