Language independent multi document summarization using latent semantic indexing/clustering techniques
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Bu tez dilden bağımsız olarak çoklu dokümanlardan özet çıkarılması üzerine yaptığımız araştırmayı içermektedir. Özetleme işlemimizde saklı anlamsal indeksleme ve sanal merkeze dayalı kümeleme yöntemlerinden yararlandık. Sistemimizde ilk olarak saklı anlamsal analiz yöntemi kullanılarak anahtar terimler çıkarılır. Daha sonra anahtar terimleri içeren özet cümleler saklı anlam indeksleme ve sanal merkeze dayalı kümeleme yöntemleri kullanılarak çıkarılır. Yaptığımız deneyler saklı anlamsal analiz yönteminin anahtar kelimelerin çıkarılmasında başarılı olduğunu ortaya koymaktadır. Ayrıca, özet çıkarma sistemimiz diğer çoklu doküman özetleme sistemleri ile karşılaştırılınca iyi sonuçlar elde etmiştir. This thesis discusses our research on language independent multi-document summarization. We used latent semantic indexing and centroid based clustering methods in our summarization process. Firstly, our algorithm uses latent semantic analysis (LSA) to extract key-terms. Secondly, important sentences holding these key-terms are extracted by applying latent semantic indexing (LSI) and centroid-based clustering methods. Our experiments show that LSA improve key-term extraction. Also, our summarization system has achieved good results, compared to some other multi-document summarization systems.
Collections