Maschinenlernen zur Vorhersage, welche MOFs tatsächlich im Labor hergestellt werden können Metall-organische Gerüste (MOFs) gehören zu den am stärksten anpassbaren Materialien, die je geschaffen wurden – poröse Kristalle, die aus Metallknoten und organischen Verbindern zusammengesetzt sind, mit Anwendungen von Gasspeicherung bis Katalyse. Rechnerisch können wir Billionen möglicher Strukturen generieren. Das Problem ist, dass fast keine von ihnen synthetisiert wird. Von Tausenden von MOF-Screenings, die bisher veröffentlicht wurden, haben nur etwa ein Dutzend zu tatsächlichen Laborsynthesen geführt, und selbst dann neigen Chemiker dazu, "sichere" Designs auszuwählen, die bekannten Strukturen ähneln, anstatt den rechnerisch optimalen. Andre Niyongabo Rubungo und Mitautoren gehen dieses Engpassproblem mit drei Zutaten an: (1) MOFMinE, ein neu kuratiertes Dataset von fast einer Million MOFs mit simulierten Spannungsenergien und freien Energien für eine Teilmenge von 65.000 Strukturen; (2) MOFSeq, eine Sequenzdarstellung, die sowohl lokale Merkmale (SMILES der Bausteine) als auch globale Merkmale (Topologie und Konnektivität) kodiert; und (3) LLM-Prop, ein 35-Millionen-Parameter-Sprachmodell, das auf den umfangreichen Spannungsenergiedaten vortrainiert und dann auf die kostspieligeren Berechnungen der freien Energie feinabgestimmt wurde. Die Ergebnisse sind beeindruckend: ein mittlerer absoluter Fehler von 0,789 kJ/mol, 97% Genauigkeit bei der Vorhersage der Synthesefähigkeit und 78% Genauigkeit bei der Auswahl des richtigen Polymorphs unter konkurrierenden Strukturen. Selbst wenn sich zwei Polymorphe nur um 0,16 kJ/mol unterscheiden, wählt das Modell immer noch über 60% der Zeit das richtige aus. Die praktische Implikation ist: Was früher Tage der molekularen Simulation erforderte, benötigt jetzt einen Vorwärtsdurchlauf durch ein neuronales Netzwerk. Dies eröffnet einen Weg, um routinemäßig rechnerische MOF-Screenings nach vorhergesagter Synthesefähigkeit zu filtern – was es Experimentatoren ermöglicht, über "intuitive" Designs hinaus in unerforschte Bereiche des chemischen Raums vorzudringen, während sie gleichzeitig die Chancen verbessern, dass das, was am Computer gut aussieht, tatsächlich im Labor hergestellt werden kann. Papier: