Data mining for methane adsorption over metal organic frameworks in literature
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Metal organik yapılar (MOF) üzerinde hem kütlesel hem de hacimsel CH4 depolama ve taşıma için 3000 veri noktası içeren bir veri tabanı, genellenebilir bilgiler çıkarmak için RStudio ortamında makine öğrenmesi araçları kullanılarak analiz edilmiştir. Veri tabanı, öncelikle eksik değerler ve uygun olmayan giriş değişkenleriyle başa çıkmak için yeniden işleme aşamasını geçmiştir. Bu aşamada çapraz korelasyon analizi de yapılmış ve ilişkili değişkenler belirlenmiştir. Sonra, en iyi modellerin koşullarını bulmak için optimizasyon süreci gerçekleştirilmiştir. İlk olarak, veri tabanı, temel eğilimleri ve modelleri gözlemlemek için gözden geçirilmiştir. Daha sonra saklı bilgileri ortaya çıkarmak ve gelecekteki çalışmalar için kurallar ve modeller geliştirmek için veri tabanı, karar ağaçları ve yapay sinir ağları kullanılarak analiz edilmiştir. Her analizde, daha önce görülmeyen verilerle modellerin geçerliliğini test etmek için beş kat çapraz doğrulama kullanılmıştır. Karar ağacı analizleri, altı kullanıcı tanımlı tanımlayıcı ve iki yapısal özellik kullanılarak ayrı ayrı gerçekleştirilmiştir. Kristal yapı ve MOF molekülünün toplam doymamışlık derecesi, etkin kullanıcı tanımlı tanımlayıcılar olarak bulunurken, yapısal özellikler olarak gözenek hacmi ve maksimum gözenek çapı, yüksek CH4 depolama ve dağıtma kapasitesine sahip MOFları belirlemek için yeterli olmuştur. Beklendiği gibi her zaman yüksek bir gözenek hacminin gerekli olduğu görülmüştür. Yapay sinir ağları analizleri, kullanıcı tanımlı tanımlayıcılar ve yapısal özellikler ayrı ayrı kullanılarak yapılmıştır. Kullanıcı tanımlı tanımlayıcıların MOFların CH4 depolama ve dağıtma kapasitesini tanımlamak için yeterli olmadığı, yapısal özelliklerin, özellikle gözenek hacminin, düşük RMSE ve yüksek R2 değerleriyle doğru CH4 depolama ve dağıtma tahmini sağladığı gözlemlenmiştir. A database containing 3000 data points for both gravimetric and volumetric CH4 storage/delivery in metal organic frameworks (MOFs) was analysed using machine learning tools via RStudio functions to extract knowledge for generalization. First, the database was passed through the reprocessing stage to deal with the missing values and inappropriate input variables. The cross-correlation analysis was also performed during this stage as well and the correlated variables were determined. Then the optimization process took place to find out the optimum conditions of the best models. First, the database was reviewed to observe the basic trends and patterns. It was then analysed using decision trees and artificial neural networks (ANN) to extract hidden information and develop rules and heuristics for the future studies. Five-fold cross validations were used in each analysis to test the validity of the models with data not seen before. Decision tree analyses were carried out using six user defined descriptors and two structural properties, separately. The crystal structure and the total degree of unsaturation were found to be the effective user defined descriptors, whereas the pore volume and maximum pore diameter, as structural properties, were sufficient to determine the MOFs having high CH4 storage/delivery capacity. Moreover, a high pore volume is always required as expected. In ANN analyses, models were performed by using the user defined descriptors and the structural properties separately. It was observed that the user defined descriptors were not sufficient to describe the CH4 storage/delivery capacity of MOFs, whereas the structural properties, especially pore volume, provided accurate CH4 storage/delivery prediction with low root mean square error (RMSE) and high coefficient of determination (R2) values.
Collections