Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jorge Bravo Abad
Prof. Fisika @UAM_Madrid | Profesor. PI dari AI untuk Lab Material | Direktur AI untuk Laboratorium Material.
Pembelajaran mesin untuk memprediksi MOF mana yang sebenarnya dapat dibuat di lab
Kerangka logam-organik (MOF) adalah salah satu bahan yang paling dapat disetel yang pernah dibuat—kristal berpori yang dirakit dari simpul logam dan penghubung organik, dengan aplikasi mulai dari penyimpanan gas hingga katalisis. Secara komputasi, kita dapat menghasilkan triliunan kemungkinan struktur. Masalahnya adalah hampir tidak ada yang disintesis. Dari ribuan skrining MOF yang diterbitkan hingga saat ini, hanya sekitar selusin yang mengarah pada sintesis laboratorium yang sebenarnya, dan bahkan kemudian, ahli kimia cenderung memilih desain "aman" yang menyerupai struktur yang diketahui daripada yang optimal secara komputasi.
Andre Niyongabo Rubungo dan rekan penulis mengatasi kemacetan ini dengan tiga bahan: (1) MOFMinE, kumpulan data yang baru dikuratori dari hampir satu juta MOF dengan simulasi energi regangan dan energi bebas untuk subset 65.000 struktur; (2) MOFSeq, representasi urutan yang mengkodekan fitur lokal (SMILES blok bangunan) dan fitur global (topologi dan konektivitas); dan (3) LLM-Prop, model bahasa 35 juta parameter yang telah dilatih sebelumnya pada data energi regangan yang melimpah, kemudian menyempurnakan perhitungan energi bebas yang lebih mahal.
Hasilnya mencolok: kesalahan absolut rata-rata 0,789 kJ/mol, akurasi 97% dalam memprediksi sintesisitas, dan akurasi 78% dalam memilih polimorf yang benar di antara struktur yang bersaing. Bahkan ketika dua polimorf berbeda hanya 0,16 kJ/mol, model masih memilih yang tepat lebih dari 60% dari waktu.
Implikasinya praktis: apa yang dulunya membutuhkan simulasi molekuler berhari-hari sekarang mengambil langkah maju melalui jaringan saraf. Ini membuka jalan untuk secara rutin menyaring skrining MOF komputasi dengan kemampuan sintesis yang diprediksi—membiarkan para eksperimental menjelajah melampaui desain "intuisi" ke wilayah ruang kimia yang belum dijelajahi, sambil tetap meningkatkan kemungkinan bahwa apa yang terlihat bagus di komputer benar-benar dapat dibuat di laboratorium.
Kertas:

2
Mengompresi jaringan tingkat tinggi tanpa kehilangan apa yang penting
Banyak sistem nyata tidak hanya terbuat dari tautan berpasangan. Obrolan grup, makalah yang ditulis bersama, ruang kelas, atau kompleks biokimia adalah interaksi kelompok yang melibatkan 3, 4, atau lebih entitas sekaligus. Hypergraph adalah cara alami untuk memodelkan ini: Anda menempatkan node untuk entitas dan "hyperedges" untuk setiap grup, dengan satu layer untuk pasangan, satu lagi untuk triple, satu lagi untuk quadruples, dan seterusnya. Tangkapannya: model tingkat tinggi ini dengan cepat menjadi besar, sulit dihitung, dan sulit ditafsirkan. Pertanyaan kuncinya adalah: seberapa banyak dari struktur orde yang lebih tinggi itu benar-benar informasi baru, dan berapa banyak yang hanya berlebihan dengan pesanan yang lebih rendah? 
Alec Kirkley, Helcio Felippe dan Federico Battiston menangani ini dengan gagasan teoritis informasi tentang reduksibilitas struktural untuk hipergraf. Pikirkan untuk mencoba mengirim seluruh jaringan tingkat tinggi melalui tautan data yang sangat mahal. Salah satu pilihannya adalah "naif": kirim setiap lapisan (pasangan, triple, 4-tuple, ...) secara mandiri. Alternatif mereka lebih cerdas: kirim hanya satu set kecil lapisan "perwakilan", lalu jelaskan yang tersisa sebagai salinan yang berisik, hanya menggunakan perbedaannya. Semakin banyak struktur yang tumpang tindih antara ordo (misalnya, ketika semua interaksi 2 dan 3 benda sudah tersirat oleh 5 benda tersebut), semakin banyak Anda dapat mengompres.
Mereka mengubahnya menjadi skor yang dinormalisasi η antara 0 (tanpa kompresibilitas) dan 1 (bersarang dengan sempurna, dapat direduksi sepenuhnya), dan model reduksi eksplisit yang hanya mempertahankan ukuran interaksi non-redundan. Angka-angka dalam makalah menunjukkan contoh sederhana di mana hipergraf empat lapis dapat dikurangi secara optimal menjadi hanya dua lapisan sambil tetap menangkap organisasi tingkat tinggi yang penting. 
Mereka kemudian menguji ini pada data sintetis dan nyata. Pada hipergraf mainan "bersarang" yang terkontrol, η dengan mulus menurun saat mereka menyuntikkan keacakan — berperilaku seperti dial dari "terstruktur sempurna" menjadi "sepenuhnya acak". Pada sistem nyata (kepenulisan bersama, jaringan kontak, utas email, sistem penandaan, dll.), Banyak yang ternyata sangat dapat dikompresi: Anda dapat menjatuhkan beberapa pesanan hyperedge dan hanya menyimpan sebagian kecil lapisan, namun mempertahankan konektivitas global, struktur komunitas, dan bahkan perilaku dinamika model pemilih tingkat tinggi di atas jaringan. 
Kesimpulannya: Anda sering kali tidak memerlukan deskripsi tingkat tinggi yang lengkap dan berat untuk mempelajari sistem yang kompleks. Dengan lensa teoritis informasi yang tepat, Anda dapat mengidentifikasi ukuran kelompok mana yang benar-benar menambahkan struktur baru, membangun hipergraf yang jauh lebih kecil, dan tetap dengan setia menangkap pola dan dinamika kolektif yang Anda pedulikan. 
Kertas:

80
Jalur mekanistik pembelajaran mendalam, bukan hanya lanskap energi
Ketika ahli kimia atau biofisikawan berbicara tentang mekanisme, mereka benar-benar bertanya: apa rute yang paling mungkin diambil sistem saat bergerak dari keadaan A ke keadaan B? Dalam bahasa mekanika statistik, itu adalah jalur energi bebas minimum (MFEP) di lanskap berdimensi tinggi yang kasar. Tangkapannya adalah bahwa menyatukan permukaan energi bebas penuh untuk reaksi realistis, pelipatan protein, atau pengikatan ligan sangat mahal—bahkan dengan pengambilan sampel modern yang ditingkatkan.
Revanth Elangovan dan rekan penulis mengambil rute yang berbeda: alih-alih terlebih dahulu menghitung seluruh lanskap, mereka mempelajari jalur itu sendiri dengan pembelajaran multitugas mendalam yang digabungkan erat dengan metadinamika yang teratur. Jaringan saraf mereka adalah autoencoder yang variabel laten 1D bertindak sebagai "koordinat jalur" berbasis data, sementara kehilangan Deep-TDA menyematkan ujung manifold 1D ini ke cekungan reaktan dan produk. Metadinamika bias di sepanjang koordinat "kemajuan" laten mendorong gerakan di sepanjang jalur saat ini; Bias kehilangan rekonstruksi mendorong pengambilan sampel menjauh darinya untuk menemukan rute alternatif. Jadwal simulasi anil pada bias metadinamika membantu sistem menetap di MFEP global daripada lokal.
Setelah model menyatu, dekoder menjadi generator mekanisme: dengan berbaris di sepanjang jalur laten dan mendekode kembali ke ruang deskriptor penuh, metode ini menghasilkan "sidik jari mekanistik"—urutan perubahan struktural yang menggambarkan reaksi atau transisi konformasi dengan cara yang dapat dibaca mesin. Para penulis menunjukkan ini pada tiga masalah yang sangat berbeda: isomerisasi hidrobrominasi fase gas di mana MFEP dengan benar melewati reaktan sejati, lipatan chignolin di mana jalur yang dipelajari memulihkan urutan penataan ulang ikatan hidrogen yang diketahui, dan sistem inang-tamu kalixarena di mana algoritma menemukan kembali jalur pelepasan ikatan "basah" yang dimediasi air yang mendominasi rute kering.
Pesan yang lebih besar menarik: dengan menggabungkan pengambilan sampel yang disempurnakan dengan pembelajaran mendalam, Anda dapat melewati kebutuhan untuk menyatukan permukaan energi bebas dimensi tinggi penuh, langsung mengejar jalur energi bebas minimum, dan secara otomatis mengubah jalur itu menjadi sidik jari kuantitatif dari mekanisme. Itu membuka pintu ke kelas model baru di mana kita tidak hanya mempelajari properti dari struktur statis, tetapi juga dari sidik jari mekanistik—menggunakan ML untuk memprediksi kinetika, katalis desain, atau ligan layar berdasarkan bagaimana mereka bergerak melalui lanskap energi yang kompleks, bukan hanya di mana mereka memulai dan berakhir.
Kertas:

103
Teratas
Peringkat
Favorit
