Show simple item record

dc.contributor.advisorGülbandılar, Eyyüp
dc.contributor.authorKaya, Ahmet
dc.date.accessioned2023-09-22T12:18:07Z
dc.date.available2023-09-22T12:18:07Z
dc.date.submitted2022-12-05
dc.date.issued2022
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/739244
dc.description.abstractİnternet üzerinde üretilen veriler her geçen gün artmaktadır. Bu verilerin çoğunluğunu metinler oluşturmaktadır. Metinlerin çoğunlukta olması, bilim insanlarını bu alandaki problemler üzerinde daha fazla çalışma yapmaya yönlendirmiştir. Metinler üzerinde yapılan çalışmaların son zamanlarda en popüler yöntemi konu modelleme yöntemleridir. Konu modelleme yöntemlerinin amacı metinlerin içerisindeki gizli veya açık geçen konuları tespit etmektir. Bu çalışma kapsamında elde edilen metin veri kümeleri üzerinde gizli dirichlet ayrımı (GDA), ilişkili konu modeli (İKM) ve yapısal konu modeli (YKM) yöntemleri uygulanmıştır. Çalışmada konu modelleme yöntemlerinin sonuçlarını karşılaştırabilmek içinkonu tutarlılığı ve çapraşıklık değerleri kullanılmıştır. YKM yöntemini anlatan makalede kullanılan veri ve bu verinin ham hali, internet kaynaklı elde edilen İngilizce otel müşteri yorumları ve Türkçe otel müşteri yorumları olmak üzere 4 farklı veri üzerinde çalışmalar yapılmıştır. Yapılan tüm çalışmalar tutarlılık ve çapraşıklık değeri hesaplanıp sonuçlarıkarşılaştırılmıştır. İngilizce veri üzerinde yapılan çalışmaların sonuçlarına bakıldığında YKM tip 1 yönteminin diğer yöntemlere göre daha başarılı olduğu görülmüştür. Türkçe veri üzerinde İKM tip 2 yöntemi daha başarılı olmuştur. Sonuçlar genel olarak incelendiğinde c_v tutarlılık ölçümünün çapraşıklık değeri ile tutarlı olduğu gözlenmiştir. İngilizce veriler için tutarlılık ve çapraşıklık değer karşılaştırmaları uyumluyken Türkçe veri üzerindeki sonuçlarda uyum gözlenmemiştir.
dc.description.abstractThe amount of data generated on the Internet is increasing every day. Texts constitute the majority of this data. The fact that the texts are in the majority has prompted scientists to conduct further studies into the problems in this field. The most popular method of studying texts recently is subject modeling methods. The purpose of topic modeling methods is toidentify hidden or open topics in texts. Within the scope of this study, latent dirichlet allocation (LDA), correlated topic model (CTM), and structural topic model (STM) methods were applied to the text data sets obtained within the scope of this study. In the study, subject consistency and perplexity values are used to compare the results of subject modelingmethods. The studies have been carried out on four different datasets, which include the raw form of data used in the article describing the STM method; the English and Turkish hotel customer reviews obtained from the internet. The coherence and perplexity values of all the studies were calculated, and the results were compared. When the results of the studies conducted on the English data are examined, it has been seen that the STM type 1 method is more successful than other methods. Furthermore, the CTM type 2 method performs better on Turkish data. When the results are examined in general, it is observed that the c_v coherence measurement is consistent with the perplexity value. While the comparisons of coherence and perplexity values for the English data are compatible, no agreement is observed in the results for the Turkish data.en_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleOtel yorumları üzerinde konu modelleme algoritmalarının uygulanması
dc.title.alternativeApplication of topic modeling algorithms on hotel reviews
dc.typemasterThesis
dc.date.updated2022-12-05
dc.contributor.departmentBilgisayar Mühendisliği Ana Bilim Dalı
dc.identifier.yokid10245730
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityESKİŞEHİR OSMANGAZİ ÜNİVERSİTESİ
dc.identifier.thesisid759052
dc.description.pages66
dc.publisher.disciplineDonanım Bilim Dalı


Files in this item

FilesSizeFormatView

There are no files associated with this item.

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess