Show simple item record

dc.contributor.advisorÖzbayoğlu, Ahmet Murat
dc.contributor.authorSari, Mustafa
dc.date.accessioned2021-05-08T11:20:49Z
dc.date.available2021-05-08T11:20:49Z
dc.date.submitted2018
dc.date.issued2019-05-23
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/682548
dc.description.abstractÇalışmamızda kaleme alınmış yazıların, yazarına ve konusuna göre birbirindenayrılması ve sınıflandırılabilmesi amaçlanmıştır. Bir gazetenin köşe yazarlarınınyazılarının vektörleri oluşturulmuştur ve birbirinden ne kadar ayrılabildiğinin analiziyapılmıştır. Yazarı bilinmeyen herhangi bir yazının hangi yazara ait olduğubelirlenebilir veya birbirlerine benzer stiller gruplanarak yazar profillerioluşturulabilir. Konusu bilinmeyen bir yazının hangi konulara ait olabileceğibelirlenebilir. DeepLearning4J Java kütüphanesi ve burada yer alan Doc2Vec sınıfıkullanılmıştır. 5,10,15 ve 20 yazar içeren modeller ve yazarların yazdıkları konularagöre modeller geliştirilmiştir. Bu şekilde elde edilen benzerlik vektörleri belirli bir eşikdeğeri ile karşılaştırılmıştır, değişik eşik değerleri seçimine bağlı model başarımlarıölçülmüştür. Elde edilen sonuçlara göre bazı yazarlar belirgin bir şekilde diğeryazarlardan ayrılmaktadır. Yazılar konularına göre başarılı bir şekildeetiketlenebilmektedir. Bu yapı özellikle yazar profili çıkarımı, yazı tespiti veya konugruplama gibi alanlarda kullanılabilecek niteliktedir.
dc.description.abstractIn our study, it is aimed to distinguish and classify author profiles and text subjectswith vectors which were created from authors posts. The vectors of the columnists ofa newspaper were formed and analyzed for how much they could be separated fromeach other. Hence, author of any post, can be determined by this model. It also cangroup similar styles together. The DeepLearning4J Java library and the Doc2Vec classincluded are used during development. 5,10,15, 20 author vector models and theirsubject models were created according to their posts. The similarity vectors obtainedin this way were compared with a certain threshold value, and the model performancesbased on the selection of different threshold values were measured. According to theresults, some authors differed significantly from other authors. Articles can besuccessfully labeled according to their topics. This structure can be used especially inareas such as author profile extraction, article detection or subject grouping.en_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.titleDerin öğrenme yöntemleri kullanılarak Türkçe doküman sınıflandırma
dc.title.alternativeClassification Turkish documents using deep learning techniques
dc.typemasterThesis
dc.date.updated2019-05-23
dc.contributor.departmentBilgisayar Mühendisliği Ana Bilim Dalı
dc.identifier.yokid10229970
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityTOBB EKONOMİ VE TEKNOLOJİ ÜNİVERSİTESİ
dc.identifier.thesisid542590
dc.description.pages63
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess