Tüketici tercihlerinin yapay sinir ağları yöntemiyle tahmini: Perakende sektöründe bir uygulama
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Hızla değişen dünya ekonomisi, küresel işbirliklerinin artması, teknolojinin gelişmesiyle birlikte tüketicilerin bilgiye kolay ulaşabilmesi ve tüketicilerin isteklerinin sürekli değişmesi nedeniyle perakende sektöründe ve pazarlama alanında veri madenciliğinin önemi giderek artmaktadır. Tüketicilerin isteklerini hızlı bir şekilde anlayarak onların beklentilerini karşılayabilecek ürün veya hizmetlerin üretilebilmesi için; perakende mağazada yapılan alışveriş kayıtları, sosyal medya ortamında yapılan paylaşımlar, online alışveriş kayıtları, blog yazıları, online şikayet kanalları gibi bir çok kanaldan elde edilen veriler işlenerek değerli bilgiler elde edilmekte ve bu bilgiler üretim aşamasında dikkate alınmaktadır. Ayrıca mağaza yöneticileri karar alma süreçlerinde de bu bilgilerden faydalanmaktadırlar.Bu çalışmanın amacı, perakende mağazası müşterilerinin geçmiş ürün veya hizmet satın alma davranışlarının incelenerek bir davranış modelinin ortaya çıkarılması ve bu model yardımıyla müşterilerin gelecekte satın alabileceği ürün veya hizmetlerin tahmin edilmesidir. Tahminleme modelinin oluşturulmasıyla beraber benzer davranış sergileyen tüketiciler, kümeleme analizi ile gruplandırılmıştır.Hazırlanan çalışma beş bölümden oluşmaktadır. İlk dört bölümde kapsamlı bir literatür taraması yapılmış, son bölümde ise alan araştırması yapılmıştır. Literatür kısmında tüketici, tüketici satın alma davranışları, perakendecilik kavramı, perakende sektöründe tüketici davranışları ve veri madenciliği süreci ile ilgili yapılan çalışmalar incelenerek teorik bir alt yapı oluşturulmaya çalışılmıştır. Çalışmanın beşinci bölümünde nicel araştırma tekniklerinden birliktelik kuralları oluşturma, kümeleme ve tahminleme yöntemleri kullanılarak uygulama gerçekleştirilmiştir. Veriler işlenebilir hale getirildikten sonra kümeleme analizi yapılmış ve benzer davranış sergileyen tüketiciler gruplanmıştır. Ayrıca, Apriori Algoritması yardımıyla Pazar Sepeti Analizi yapılmış, satın alınan ürünler arasındaki ilişkiyi belirlemek üzere birliktelik kuralları oluşturulmuştur. Elde edilen birliktelik kuralları yapay sinir ağları yardımıyla bir tahminleme modeline dönüştürülmüş ve son olarak, yapay sinir ağlarının etkinliğini ölçebilmek için Lojistik Regresyon Analizi ile kıyaslama yapılmıştır. Temel analizler (frekans dağılımı, veriyi dönüştürme, transpoze vb.), kümeleme analizi ve lojistik regresyon analizi SPSS 22 ve Visual Basic yardımı ile yapılmıştır. Birliktelik kuralı ve tahminleme modelinin kurulması ise MATLAB programı yardımı ile yapılmıştır. Çalışmada nicel araştırma yöntemi benimsenmiştir. Araştırma evreni Kütahya'da faaliyet gösteren perakende mağazasından alışveriş yapan 18 yaş üstü tüketicilerden oluşmaktadır. Araştırma verileri perakende mağazasının veri tabanında yer alan tüketicilerin 2016, 2017 ve 2019 yıllarına ait alışveriş kayıtlarından elde edilmiştir. Araştırmada toplam 489 müşteriye ait 26.543 adet alışveriş kaydı kullanılmıştır. Alışverişler 45.650 adet satın alınan ürün, 40 adet ürün grubu ve 3.982 farklı ürün kaydından oluşmaktadır. Çalışma sonunda 103 birliktelik kuralı oluşturulmuş, bu birliktelik kurallarından %90'nın üzerinde güven değerine sahip 26 birliktelik kuralı ve dört demografik değişken tahminleme modelinde girdi parametresi olarak kullanılmıştır. Tahmin edilmesi gereken toplam 26 birliktelik kuralı olduğundan çıktı katmanı 26 olarak belirlenmiştir. Tahminleme yapay sinir ağları ve lojistik regresyon yöntemleri kullanılarak yapılmış ve sonuçları kıyaslanmıştır. Yapay sinir ağları azami 15 iterasyon ile ortalama %99,9621'lik bir doğru tahminleme sonucu elde ederken, lojistik regresyon yöntemi azami 20 iterasyon ile ortalama %89,8305'luk bir doğru tahminleme sonucu elde etmiştir. Analiz sonuçlarına göre, yapay sinir ağları yöntemi lojistik regresyon yöntemine göre daha yüksek düzeyde doğru tahminleme sonuçları vermiştir.Kümeleme analizinde toplam 10 küme elde edilmiştir. Ürün grupları sayısı yüksek olduğundan kümeleme kalitesi düşük düzeydedir. Verilerin kümelere dağılımı dengeli ve kümeler arası farklılıklar yüksek düzeyde bir önem derecesine sahiptir. Toplam beş değişkenden (cinsiyet, yaş, alışverişin yapıldığı ay, alışverişin yapıldığı saat, ürün grupları) oluşan kümelerde ürün gruplarının küme içindeki önem derecesi %86 iken, diğer değişkenlerin önem derecesi %100 olarak elde edilmiştir. In view of the rapidly developing world economy, increasing global cooperation, easy access to information by consumers thanks to technological developments and constantly changing consumer wishes, data mining in the retail sector and marketing has become more today. In order to produce products or services that can meet the expectations of consumers by understanding their demands, the data obtained from many channels such as shopping records in retail stores, actions on social media, online shopping records, blog posts, online complaint channels are processed and valuable information is obtained and this information is taken into consideration during production. Store managers also benefit from this information in decision-making processes.This study aims to put forward a behavioral model by examining retail store customers' past product or service purchase behaviors and predict the products or services that customers can purchase in the future with the help of this model. Via the formation of prediction model, consumers with similar behavior were grouped with clustering analysis.The study consists of five chapters. The first four chapters are comprised of a comprehensive literature search and the last chapter presents a field research.In the literature section, studies on the concept of consumer, consumer purchase behaviors, retailing concept, consumer behaviors in retail sector and data mining process are examined to set a theoretical background.In the fifth part of the study, the application was carried out using quantitative research techniques such as association rules, clustering and prediction model. After the data was processed, clustering analysis was performed and the consumers with similar behavior were grouped. In addition, Market Basket Analysis was performed with the help of Apriori Algorithm and association rules were established to determine the relationship between the products purchased. The established association rules were transformed into an prediction model with the help of artificial neural networks, and finally, a comparison was made by Logistic Regression Analysis to measure the effectiveness of artificial neural networks. Basic analyzes (frequency distribution, data conversion, transpose, etc.), clustering analysis and logistic regression analysis were performed with the help of SPSS 22 and Visual Basic. The association rule and prediction model were established with the help of MATLAB program.In this study, quantitative research method was used. The population of the study consists of the consumers aged over 18 who shop from a retail store in Kütahya. The data was collected from the 2016, 2017 and 2019 shopping records of the consumers who are in the database of the retail shop. In the study, 26.543 shopping records which belong to the 489 costumers were used. The shopping consists of 45.650 purchased products, 40 product groups, and 3.982 product records.At the end of this study, 103 association rules were created, and 26 association rules which have over 90% confidence value and 4 demographic variables were used as input parameter in the prediction model. As there were 26 association rules to be predicted in total, the output layer was determined as 26. The prediction was conducted with the artificial neural networks and the logistic regression methods, and the results were compared. While the artificial neural networks had 99, 9621% correct prediction result with the maximum of 15 iterations, the logistic regression method had 89,830% correct prediction result with the maximum of 20 iterations. It turns out from the analysis results that the artificial neural networks method gave higher level of correct prediction results when compared to logistic regression method.In the cluster analysis, 10 clusters were obtained. Since the number of the product groups were high, the quality of clustering were low. The distribution of data into clusters is balanced, and the differences between the clusters has high level of importance. In the clusters which were composed of five variables (gender, age, the month of the shopping, the time of the shopping, and the product groups), the level of importance of the product groups within a cluster was obtained as 86%, while the other variables had 100% level of importance.
Collections