Naive bayes yöntemi ile blog içeriklerinin sınıflandırılması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
İnternet teknolojilerinin gelişimi ile birlikte bilginin ayılımı ve miktarı da artmıştır. Artan bilgi içerisinde, kullanıcıların kaliteli ve doğru içeriklere ulaşması da gittikçe zorlaşmaktadır. Blog içerikleri, sosyal medya siteleri gibi yapılar, bilginin artmasında ve yayılımında en önemli etmenler haline gelimiştir. Bu tezde, kategorileri editör vasıtası ile belirlenmiş blogların içerikleri, kelime ve kelime gruplarına ayrıştırılmıştır. Bu gruplar 8 kategori altında sınıflandırılmıştır. Daha sonra eğitim kümesi oluşturulmuştur. Bu eğitim kümesi kullanılarak, veri madenciliği algoritmalarından birisi olan Naive Bayes algoritması ile kategorisi belli olmayan bir test içeriğinin hangi kategoriye ait olacağını bulan uygulama başarılı bir şekilde yapılmıştır. Quantity and spread of knowledge is increased with the development of internet technologies. Increased knowledge makes it hard for users to reach qualified and right contents. Blog contents and social media sites has become important factors to increase and spread knowledge. In this thesis; blog contents, which were specified by editor, are split as words and word groups and classified in 8 categories and then training set was created. The application to predict the category of an unclassified test data is successfully done by using this training set, with the Naive Bayes algorithm which is one of the data mining techniques.
Collections