Evaluation of taxonomy based concept extraction system cosmix case for text categorization
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu çalışmanın amacı Vektör Uzay Modeli kullanılarak bir Doküman sınıflandırma sistemi ortaya koymaktır. Daha sonra kosinüs benzerliği kullanarak öğrenme dokümanları ve test dokümanları arasında benzerlikler hesaplanmıştır. Son olarak yüksek benzerlikli dosyalar üzerinden kategori tahminlemesinde bulunulmuştur. Aynı tahminleme sistemi Kosmix dosyaları üzerinde de uygulanarak sonuçlar karşılaştırılmıştır. Kosinüs benzerliği metodunun daha başarılı olduğu sonucuna varılmıştır. The aim of this study is creating a Document Classification system using Vector Space Model as baseline classifier. Cosine similarity is used to calculate similarity between Training Set and Test Set. Finally similar files are used to suggest topics for test files. Same method is used to create Kosmix Training and Test Sets and suggest topics. Results are compared and comparison results whon that Cosine Similarity method is more successful.
Collections