Uczenie maszynowe do przewidywania, które MOFy można rzeczywiście wytworzyć w laboratorium Metalowo-organiczne ramy (MOFy) są jednymi z najbardziej dostosowywalnych materiałów, jakie kiedykolwiek stworzono—porowate kryształy zbudowane z węzłów metalowych i organicznych łączników, z zastosowaniami od magazynowania gazu po katalizę. Obliczeniowo możemy generować biliony możliwych struktur. Problem polega na tym, że prawie żadna z nich nie jest syntetyzowana. Spośród tysięcy badań MOF opublikowanych do tej pory, tylko około tuzina doprowadziło do rzeczywistej syntezy laboratoryjnej, a nawet wtedy chemicy mają tendencję do wybierania "bezpiecznych" projektów, które przypominają znane struktury, zamiast tych obliczeniowo optymalnych. Andre Niyongabo Rubungo i współautorzy rozwiązują ten wąskie gardło za pomocą trzech składników: (1) MOFMinE, nowo skurwowany zbiór danych prawie miliona MOF z symulowanymi energiami odkształcenia i energiami swobodnymi dla podzbioru 65 000 struktur; (2) MOFSeq, reprezentacja sekwencyjna, która koduje zarówno cechy lokalne (SMILES budulców), jak i cechy globalne (topologia i łączność); oraz (3) LLM-Prop, model językowy o 35 milionach parametrów wstępnie wytrenowany na obfitych danych o energii odkształcenia, a następnie dostosowany do droższych obliczeń energii swobodnej. Wyniki są uderzające: średni błąd bezwzględny wynosi 0,789 kJ/mol, 97% dokładności w przewidywaniu możliwości syntezy oraz 78% dokładności w wyborze właściwego polimorfu spośród konkurencyjnych struktur. Nawet gdy dwa polimorfy różnią się tylko o 0,16 kJ/mol, model nadal wybiera właściwy ponad 60% czasu. Implikacja jest praktyczna: to, co kiedyś wymagało dni symulacji molekularnej, teraz zajmuje jedynie przejście przez sieć neuronową. Otwiera to drogę do rutynowego filtrowania obliczeniowych badań MOF według przewidywanej możliwości syntezy—pozwalając eksperymentatorom na eksplorację "intuicyjnych" projektów w nieodkrytych obszarach przestrzeni chemicznej, jednocześnie zwiększając szanse, że to, co wygląda dobrze na komputerze, można rzeczywiście wytworzyć w laboratorium. Artykuł: