Yazılım geliştirme taleplerinin metin madenciliği ile sınıflandırılması ve önceliklendirilmesi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Kurumsal şirketlerde, yazılımlardaki hatalar ve değişiklik talepleri genellikle bir talep yönetim sistemi üzerinden BT birimine iletilir. Bu sistemde yer alan öncelik ve aciliyet bilgisi BT birimi için kritik öneme sahiptir. Ancak, talebi giren kişilerin inisiyatifine bırakılan öncelik kararı her zaman gerçekçi olmamaktadır. Örneğin, kritik olmayan ve düşük öncelikli bir değişiklik talebi yüksek öncelikli olarak girilebilmekte, bu da hatalı planlama ve müşteri memnuniyetsizliği ile sonuçlanabilmektedir. Bu çalışmada, iç müşteri talepleri metin madenciliği yöntemleriyle sınıflandırılarak taleplerin önem derecesi tahmin edilmeye çalışılmıştır. Sistemin eğitimi ve testi için kurumsal bir şirketin talep yönetim sisteminden alınan kayıtlar kullanılmıştır. Ham metin formundaki talep verisi üzerinde temizlik ve ön işleme işlemlerinin ardından, doküman-terim matrisinin oluşturulmasında TFIDF ağırlıklandırma yönteminden yararlanılmıştır. Elde edilen veri seti üzerinde çeşitli sınıflandırma algoritmaları test edilmiş ve en yüksek başarıma %74,5 F-Skoru değeri ile Rasgele Orman algoritmasıyla ulaşılmıştır. In corporations, issues encountered in software and change demands are forwarded to the IT unit via a demand management system. The priority and severity information in this system has critical importance to the IT unit. However, the priority decision that is left to the individuals who create the demand records may not always be realistic. For instance, a non-critical and low-priority demand may be created with the highest priority, and this may lead to faulty planning and eventually to customer dissatisfaction. In this work, internal customer demands were classified using text mining techniques and their priorities were predicted. The system was trained and tested with the records extracted from the demand management system of a corporation. After cleaning and preprocessing the raw textual demand data, TFIDF weighting scheme was used when creating the document-term matrix. Several classification algorithms were tested on the data set obtained, and the highest performance was achieved by Random Forest algorithm with 74.5% F-Score.
Collections