Machine learning techniques for the estimation of material properties from light spectrum data
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Emilim spektrumu tekniği ilk simyacılar kadar eskidir. İksirlerin rengine, saydamlığına bakarak ve farklı karışımlar deneyerek onları öğrenmeye ve tanımaya çalışmışlardır. Bugünlerde bile basit, hassas ve kullanımı kolay olduğu için sıvılar ve gazlar üzerindeki çalışmalarda sıkça kullanılmaktadır. Emilim spektrumu tekniği sıvı kimyasal çözeltilerdeki bir maddenin tanınmasında veya bir molekülün yoğunluğunun ölçülmesinde kullanılabilir. Bu çalışmada farklı sıvı çözeltilerin emilim spektrumları üzerinde kısmi en küçük kareler, gradyan destekli regresyon, rastgele ormanlar, evrişimsel sinir ağları ve uzun kısa-süreli bellek modelleri eğitilerek belirli bir molekülün yoğunluğu tahmin edilmiştir. Modellerin eğitimi ve testi için büyük bir veri kümesi oluşturulmuştur. Modellerin doğruluğunu artırabilmek için veri kümesi ölçeklendirilip ve anormal verilerden temizlenmiştir. Tek ve çok görevli evrişimsel sinir ağları geliştirilmiş ve optimize edilmiştir. Modeller ortalama mutlak hata (MAE) ve belirlilik katsayısı performans metriklerine göre karşılaştırılmıştır. Deneylerde görüldüğü üzere önerilen evrişimsel sinir ağları yaklaşık %1,1 ortalama mutlak hata ile en iyi sonuçları vermiştir. The absorbance spectrum technique is as old as the first alchemists. They desired to learn and identify their potions by examining the color and opacity of solutions as different reagents were mixed, heated, and stirred. Today, it is still the most frequently used spectroscopic technique on studies of liquids and gases as it is simple, accurate, and easy to use. An absorbance spectrum can be used to identify substances or measure the concentration of a molecule in solution. In this work, partial least squares regression (PLSR), gradient boosting regression (GBR), random forests (RF), convolutional neural network (CNN) and long short-term memory (LSTM) models were trained on absorbance spectrums of different liquid solvents and concentration of a specific molecule was predicted. A large data set was collected to train and test the models. In order to increase accuracy of the models, data set was scaled and cleaned from abnormal data. Single-tasking and multi-tasking CNNs were designed and optimized. The models were compared by performance metrics of mean absolute error (MAE) and coefficient of determination. As shown in experiments, the proposed CNN models gave the best results with about 1.1% mean absolute error.
Collections