Language independent multi document summarization using latent semantic indexing/clustering techniques
dc.contributor.advisor | Görür, Abdül Kadir | |
dc.contributor.author | Alim, Suat | |
dc.date.accessioned | 2020-12-04T11:28:06Z | |
dc.date.available | 2020-12-04T11:28:06Z | |
dc.date.submitted | 2009 | |
dc.date.issued | 2018-08-06 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/78896 | |
dc.description.abstract | Bu tez dilden bağımsız olarak çoklu dokümanlardan özet çıkarılması üzerine yaptığımız araştırmayı içermektedir. Özetleme işlemimizde saklı anlamsal indeksleme ve sanal merkeze dayalı kümeleme yöntemlerinden yararlandık. Sistemimizde ilk olarak saklı anlamsal analiz yöntemi kullanılarak anahtar terimler çıkarılır. Daha sonra anahtar terimleri içeren özet cümleler saklı anlam indeksleme ve sanal merkeze dayalı kümeleme yöntemleri kullanılarak çıkarılır. Yaptığımız deneyler saklı anlamsal analiz yönteminin anahtar kelimelerin çıkarılmasında başarılı olduğunu ortaya koymaktadır. Ayrıca, özet çıkarma sistemimiz diğer çoklu doküman özetleme sistemleri ile karşılaştırılınca iyi sonuçlar elde etmiştir. | |
dc.description.abstract | This thesis discusses our research on language independent multi-document summarization. We used latent semantic indexing and centroid based clustering methods in our summarization process. Firstly, our algorithm uses latent semantic analysis (LSA) to extract key-terms. Secondly, important sentences holding these key-terms are extracted by applying latent semantic indexing (LSI) and centroid-based clustering methods. Our experiments show that LSA improve key-term extraction. Also, our summarization system has achieved good results, compared to some other multi-document summarization systems. | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | Language independent multi document summarization using latent semantic indexing/clustering techniques | |
dc.title.alternative | Saklı anlam indeksleme ve kümeleme teknikleri ile dilden bağımsız çoklu doküman özetleme | |
dc.type | masterThesis | |
dc.date.updated | 2018-08-06 | |
dc.contributor.department | Bilgisayar Mühendisliği Anabilim Dalı | |
dc.subject.ytm | Summarizing | |
dc.identifier.yokid | 357028 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | ÇANKAYA ÜNİVERSİTESİ | |
dc.identifier.thesisid | 252925 | |
dc.description.pages | 93 | |
dc.publisher.discipline | Diğer |