Estimation of success of entrepreneurship projects with data mining
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Türkiye'deki işletmelerin % 99,8'i küçük ve orta ölçekli işletmeler (KOBİ) olduğu için ekonomide önemli bir yere sahiptirler. KOBİ'lerin, özellikle de yeni kurulan KOBİ'lerin hayatta kalması önemlidir. Girişimcilerin başarısı için KOSGEB 3 yıl süreli destek vermektedir. Bununla birlikte, desteklenen girişimcilik projeleri hala başarısız olmakta ve bu projeler için ayrılan kaynağın israfına neden olmaktadır. Bu çalışma, veri madenciliği algoritmaları ile girişimcilik projelerinin başarı ve başarısızlık durumlarını tahmin etmeyi amaçlamaktadır. Böylece, tahmin doğruluğu artacak ve projeler hakkındaki kararlar bilimsel yaklaşıma dayandırılacaktır. Çalışmada kullanımak üzere 2012-2014 yılları arasında KOSGEB Gaziantep Müdürlüğü tarafından değerlendirilen projeler; yaş, cinsiyet, deneyim, eğitim, ortaklık yapısı, pazar, yer, sektör, personel ve sermaye özelliklerine göre analiz edilmiştir. Bu özelliklerin bir sonucu olarak, girişimci projelerinin başarılı olup olmadıklarına bakılmıştır. Girişimcilik projelerinden elde edilen veriler, ön işleme tabi tutularak WEKA 3.9.2 yazılımına uyarlanmıştır. Veriler C4.5, Naive Bayes, Logistic Regression, Random Forest ve Support Vector algoritmaları 10-katlamalı çarpraz doğrulama yöntemi kullanılarak sınıflandırılmıştır. Sınıflandırma sonuçları kıyaslanmıştır ve en başarılı tahmini yapan algoritma %70,75 doğruluk ile C4.5 algoritması olmuştur. C4.5 algoritması sonucunda ağacı etkileyen özellikler sırasıyla sermaye, ortak, konum ve yaş olarak bulunmuştur. Ağacı etkilemeyen özellikler ise cinsiyet, eğitim, pazar, sektör ve personeldir. Small and medium-sized enterprises (SMEs) have an important place in the economy due to the fact that 99.8% of businesses in Turkey are SMEs. It is important to survive for SMEs, especially newly founded enterprises. In order to help SMEs survive, KOSGEB provides the entrepreneurs with 3 year-support. However, the supported entrepreneurship projects still fail and cause to the waste of allocated resources for these projects. This study aimed to prevent waste of resource and to estimate the success and failure of proposed entrepreneurship projects with data mining algorithms. Thereby, the accuracy of the estimates increased and decisions about the projects were based on a scientific approach. As data of the study, the projects evaluated by KOSGEB Gaziantep Directorate between 2012-2014 were analyzed by taking some features such as age, gender, experience, education, partnership structure, market, location, sector, personnel, and capital into consideration. As a result of the analysis of the data, it has been examined whether entrepreneurial projects were successful or not. The data obtained from the entrepreneurship projects were pre-processed and adapted to WEKA 3.9.2 software. The dataset was classified using 10-fold cross-validation with C4.5, Naive Bayes, Logistic Regression, Random Forest and Support Vector algorithms. The results of the classification were compared and the C4.5 algorithm was found as the most successful algorithm with 70.75% prediction accuracy. In consequence of the C4.5 algorithm, the features affecting the tree were found as capital, partner, location, and age, respectively. The features that did not affect the tree were gender, education, market, sector, and personnel.
Collections