Çok değişkenli kontrol diyagramında kontrol dışı duruma sebep olan değişkenlerin topluluk makine öğrenme algoritmaları ile tahmini
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
sayıda değişkeni tek bir diyagram üzerinde değerlendirmektedir. Bu sayede zaman ve iş yükünden kazanım sağlamanın yanında değişkenler arasındaki ilişkiler de değerlendirilmektedir. Bu avantajların aksine oluşan kontrol dışı durumların hangi değişkenlerden kaynaklandığı belirleyememek gibi bir dezavantajı vardır. Ancak sürecin kontrol altına alınabilmesi için hangi değişkenlere düzeltici faaliyetler uygulanması gerektiği bilinmelidir. Bu konuda yardımcı bilimsel yöntemlere ihtiyaç duyulmaktadır. Literatürde kullanılan istatistiksel ve makine öğrenme teknikleri mevcuttur. İstatistiksel yöntemlerin gelecek durumları tahmin edememe eksikliğinden dolayı makine öğrenme yöntemleri kullanılmıştır. Çalışmada, bu problemi ortadan kaldırmak için kontrol dışı durumların nedenlerini sınıflandıracak makine öğrenme tabanlı bir model geliştirilmiştir. Modelin sınıflandırma doğruluklarının mümkün olan en yüksek oranlarda olması hedeflenmektedir. Tahmin doğruluklarını arttırmak için temel tekli makine öğrenme algoritmalarının optimum parametrelerle çözüm üretmesinin yanında algoritmaları birleştirerek doğrulukları arttırmayı amaçlayan topluluk makine öğrenme algoritmaları kullanılmıştır. Kullanılan 5 temel tekli algoritmanın arasından en başarılı olarak bulunan karar ağacı algoritması, torbalama (bagging) ve yükseltme (boosting) yöntemleriyle ayrı ayrı birleştirilmiş ve doğruluklar artmıştır. Geliştirilen modelde, iyileştirilen bu algoritmalar, yığılmış genelleme (stacking) yöntemi ile birleştirilerek kullanılmıştır. Topluluk algoritmalarının bu şekilde iç içe kullanılmasının tahmin doğruluklarını arttıracağı düşünülmektedir. Modelin başarısının ispatlanması için gerçek hayat uygulaması yapılmıştır. Temel tekli makine öğrenme algoritmaları ve iki topluluk algoritması ile karşılaştırılarak çalışma başarısı kanıtlanmıştır. Geliştirilen model sayesinde; hem çok değişkenli kontrol diyagramı kullanılarak zaman, maliyet ve değişkeler arası ilişkilerin de dikkate alınması gibi faydalar sağlanmıştır hem de yeni örneklerin kontrol dışı durumların nedenlerinin %98,06 gibi büyük doğruluk oranları ile tespit edilerek hızlıca çözülebilme şansı sunulmuştur. Multivariate control charts enable assessment of multi variable on a single chart rather than evaluating them individually. This control chart has the great advantage of not only saving time and workload, but also evaluating the relationships between variables. Contrary to these advantages, there is a disadvantage of not being able to determine which variables arise out of control. However, it should be known which corrective actions should be applied to the variable(s) in order to control the process. Supporting scientific methods are needed in this regard. Statistical and machine learning techniques are available in the literature. Machine learning methods have been used because of the lack of statistical methods to predict future situations. In this study, a machine learning based model has been developed to prediction of variables that the cause of out of control condition to eliminate this problem. The classification accuracy of the model is aimed to be as high as possible. In order to increase the accuracy of predictions, the basic single machine learning algorithms produce solutions with the most optimum parameters, and ensemble machine learning algorithms aiming to increase the accuracy by combining the algorithms have been used. The decision tree bagging and boosting methods, which were found to be the most successful among the 5 basic single algorithms, were combined separately and the accuracy increased. In the developed model, these two algorithms were combined with the stacking method and the other two machine learning algorithms were used together. Such use of nested ensemble algorithms is thought to improve the prediction accuracy. In order to prove the success of the model, it was applied in real life. The proposed model has been compared with the single machine learning algorithm, and two ensemble algorithms to prove the success of the study. By the help of the developed model, benefits such as consideration of time, cost and the relationships between variables have been obtained by use of multivariate control chart. In addition to fast diagnosis of the cause of out of control condition from new samples with high accuracy up to 98.06%.
Collections