Aprendizaje automático para predecir qué MOFs se pueden fabricar realmente en el laboratorio Los marcos organometálicos (MOFs) están entre los materiales más ajustables jamás creados: cristales porosos ensamblados a partir de nodos metálicos y enlaces orgánicos, con aplicaciones que van desde el almacenamiento de gases hasta la catálisis. Computacionalmente, podemos generar billones de estructuras posibles. El problema es que casi ninguna de ellas se sintetiza. De los miles de cribados de MOF publicados hasta la fecha, solo alrededor de una docena han llevado a una síntesis de laboratorio real, y aun así, los químicos tienden a elegir diseños "seguros" que se asemejan a estructuras conocidas en lugar de las óptimas computacionalmente. Andre Niyongabo Rubungo y coautores abordan este cuello de botella con tres ingredientes: (1) MOFMinE, un conjunto de datos recién curado de casi un millón de MOFs con energías de deformación simuladas y energías libres para un subconjunto de 65,000 estructuras; (2) MOFSeq, una representación de secuencia que codifica tanto características locales (SMILES de bloques de construcción) como características globales (topología y conectividad); y (3) LLM-Prop, un modelo de lenguaje de 35 millones de parámetros preentrenado en los abundantes datos de energía de deformación, y luego ajustado en los cálculos de energía libre más costosos. Los resultados son sorprendentes: un error absoluto medio de 0.789 kJ/mol, 97% de precisión en la predicción de la sintetizabilidad y 78% de precisión en la selección del polimorfo correcto entre estructuras competidoras. Incluso cuando dos polimorfos difieren solo en 0.16 kJ/mol, el modelo aún elige el correcto más del 60% de las veces. La implicación es práctica: lo que antes requería días de simulación molecular ahora toma un pase hacia adelante a través de una red neuronal. Esto abre un camino para filtrar rutinariamente los cribados computacionales de MOF por sintetizabilidad predicha, permitiendo a los experimentadores aventurarse más allá de los diseños "intuidos" hacia regiones inexploradas del espacio químico, mientras se mejora la probabilidad de que lo que se ve bien en la computadora realmente se pueda fabricar en el laboratorio. Artículo: