Strojové učení pro předpovídání, které MOF lze skutečně vyrobit v laboratoři Kovovo-organické konstrukce (MOFs) patří mezi nejladitelnější materiály, jaké kdy byly vytvořeny—pórovité krystaly sestavené z kovových uzlů a organických spojovacích prvků, s využitím od ukládání plynu až po katalýzu. Výpočetně můžeme generovat biliony možných struktur. Problém je, že téměř žádná z nich není syntetizována. Z tisíců dosud publikovaných MOF screeningů vedlo pouze asi tucet k laboratorní syntéze, a i tak chemici obvykle volí "bezpečné" návrhy, které připomínají známé struktury spíše než výpočetně optimální. Andre Niyongabo Rubungo a spoluautoři řeší tento úzký hrdlo třemi složkami: (1) MOFMinE, nově kurátorskou datovou sadou téměř jednoho milionu MOFů se simulovanými energií deformace a volných energií pro podmnožinu 65 000 struktur; (2) MOFSeq, sekvenční reprezentace, která kóduje jak lokální prvky (SMILES stavebních bloků), tak globální prvky (topologie a konektivita); a (3) LLM-Prop, jazykový model s 35 miliony parametrů předtrénovaný na hojných datech o energii deformace a následně doladěn na dražších výpočtech volné energie. Výsledky jsou pozoruhodné: průměrná absolutní chyba 0,789 kJ/mol, 97% přesnost v predikci syntetizovatelnosti a 78% přesnost při výběru správného polymorfu mezi konkurenčními strukturami. I když se dva polymorfy liší jen o 0,16 kJ/mol, model si stále vybere ten správný více než 60 % času. Důsledek je praktický: to, co dříve vyžadovalo dny molekulární simulace, nyní prochází neuronovou sítí. To otevírá cestu k rutinnímu filtrování výpočetních MOF screeningů podle předpokládané syntetizability – což umožňuje experimentátorům proniknout za hranice "intuitovaných" návrhů do neprozkoumaných oblastí chemického prostoru, přičemž stále zvyšuje šanci, že to, co vypadá dobře na počítači, může být skutečně vyrobeno v laboratoři. Článek: