Machine learning voor het voorspellen welke MOFs daadwerkelijk in het lab kunnen worden gemaakt Metaal-organische structuren (MOFs) behoren tot de meest aanpasbare materialen die ooit zijn gemaakt—porieuze kristallen samengesteld uit metaalknopen en organische koppelingen, met toepassingen van gasopslag tot katalyse. Computationeel kunnen we triljoenen mogelijke structuren genereren. Het probleem is dat bijna geen van deze structuren wordt gesynthetiseerd. Van duizenden MOF-screenings die tot nu toe zijn gepubliceerd, hebben slechts ongeveer een dozijn geleid tot daadwerkelijke laboratoriumsynthese, en zelfs dan kiezen chemici meestal voor "veilige" ontwerpen die lijken op bekende structuren in plaats van de computationeel optimale. Andre Niyongabo Rubungo en co-auteurs pakken deze bottleneck aan met drie ingrediënten: (1) MOFMinE, een nieuw samengestelde dataset van bijna een miljoen MOFs met gesimuleerde spanningsenergieën en vrije energieën voor een subset van 65.000 structuren; (2) MOFSeq, een sequentie-representatie die zowel lokale kenmerken (SMILES van bouwstenen) als globale kenmerken (topologie en connectiviteit) encodeert; en (3) LLM-Prop, een taalmodel met 35 miljoen parameters dat is voorgetraind op de overvloedige spanningsenergiedata, en vervolgens is fijn afgestemd op de duurdere vrije-energieberekeningen. De resultaten zijn opvallend: een gemiddelde absolute fout van 0,789 kJ/mol, 97% nauwkeurigheid in het voorspellen van synthetiseerbaarheid, en 78% nauwkeurigheid in het selecteren van de juiste polymorf onder concurrerende structuren. Zelfs wanneer twee polymorfen slechts 0,16 kJ/mol van elkaar verschillen, kiest het model nog steeds de juiste meer dan 60% van de tijd. De implicatie is praktisch: wat vroeger dagen van moleculaire simulatie vereiste, kost nu een enkele doorgang door een neuraal netwerk. Dit opent een pad naar het routinematig filteren van computationele MOF-screenings op basis van voorspelde synthetiseerbaarheid—waardoor experimentele wetenschappers verder kunnen gaan dan "intuïtieve" ontwerpen in onontgonnen gebieden van de chemische ruimte, terwijl ze nog steeds de kansen verbeteren dat wat er goed uitziet op de computer daadwerkelijk in het lab kan worden gemaakt. Paper: