Машинное обучение для предсказания, какие MOF на самом деле можно создать в лаборатории Металлоорганические каркасы (MOF) являются одними из самых настраиваемых материалов, когда-либо созданных — пористые кристаллы, собранные из металлических узлов и органических связующих, с применением от хранения газа до катализа. Вычислительно мы можем генерировать триллионы возможных структур. Проблема в том, что почти ни одна из них не синтезируется. Из тысяч скринингов MOF, опубликованных на сегодняшний день, только около дюжины привели к фактическому лабораторному синтезу, и даже тогда химики, как правило, выбирают "безопасные" дизайны, которые напоминают известные структуры, а не вычислительно оптимальные. Андре Нийонгабо Рубунго и соавторы решают эту проблему с помощью трех компонентов: (1) MOFMinE, недавно собранный набор данных из почти миллиона MOF с симулированными энергиями деформации и свободными энергиями для подмножества из 65,000 структур; (2) MOFSeq, представление последовательности, которое кодирует как локальные характеристики (SMILES строительных блоков), так и глобальные характеристики (топология и связность); и (3) LLM-Prop, языковая модель с 35 миллионами параметров, предварительно обученная на обильных данных о энергии деформации, а затем дообученная на более дорогих расчетах свободной энергии. Результаты впечатляют: средняя абсолютная ошибка составляет 0.789 кДж/моль, 97% точности в предсказании синтезируемости и 78% точности в выборе правильного полиморфа среди конкурирующих структур. Даже когда два полиморфа отличаются всего на 0.16 кДж/моль, модель все равно выбирает правильный более чем в 60% случаев. Практическое значение таково: то, что раньше требовало дней молекулярного моделирования, теперь занимает один проход через нейронную сеть. Это открывает путь к рутинной фильтрации вычислительных скринингов MOF по предсказанной синтезируемости — позволяя экспериментаторам выходить за пределы "интуитивных" дизайнов в неизведанные области химического пространства, при этом все еще повышая шансы на то, что то, что выглядит хорошо на компьютере, действительно можно создать в лаборатории. Статья: