Babelnet ile zenginleştirilen twıtter doküman uzayında duygu analizi için işbirlikçi model kurulması
dc.contributor.advisor | İlhan Omurca, Sevinç | |
dc.contributor.author | Sevim, Semih | |
dc.date.accessioned | 2020-12-29T12:50:33Z | |
dc.date.available | 2020-12-29T12:50:33Z | |
dc.date.submitted | 2019 | |
dc.date.issued | 2020-02-24 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/414272 | |
dc.description.abstract | Duygu ve düşüncelerin paylaşımında kullanılan sosyal medya uygulamaları insanların birbirleriyle kolay ve hızlı iletişim kurmalarını sağlayan kullanışlı araçlardır. Çeşitli konular ile ilgili görüşlerin paylaşıldığı bu uygulamalar içerdikleri veri miktarı nedeniyle birçok araştırma alanı için kaynak oluşturmaktadır. Örneğin organizasyonların ürünleriyle ilgili pazar analizi yapması, hükümetlerin yaptığı çalışmalar ile ilgili halkın görüşünü belirlemek yapılan araştırmalar arasındadır. Sosyal medya uygulamaları, sağladıkları zengin veri içeriği yanında birçok zorluğu da bünyesinde barındırmaktadır. Üretilen elektronik dokümanların büyük bir bölümü dil bilgisi ve yazım kurallarına uymamaktadır. Ayrıca dokümanların içerdiği ifade simgeleri, kısaltmalar ve argo kelimeler kullanışlı bilginin elde edilmesindeki engellerin arasındadır. Bilgi çıkarımında karşılaşılan en büyük zorluk dokümanların kısa olmasıdır. Sayılan tüm zorluklar doküman analizini daha karmaşık hale getirmektedir. Gerçekleştirilen bu tez çalışmasında bahsedilen zorlukları aşmak için işbirlikçi öğrenme modeli önerilmiştir. Dokümanlardaki yazım hatalarını ve kısaltmaları düzeltmek için bir sözlükten kullanılmıştır. Model için gerekli doküman uzayı BabelNet anlamsal ağı kullanılarak zenginleştirilmiştir. Zenginleştirilen doküman uzayından üç farklı veri kümesi oluşturulmuş, bu veri kümeleri işbirlikçi öğrenme modelinin kurulmasında kullanılmıştır. Tezin sonunda yapılan işlemler ve işbirlikçi öğrenme modelinin sonuçları incelenmektedir. | |
dc.description.abstract | Social media applications, which are used to share feelings and thoughts, are useful tools that enable people to communicate with each other easily and quickly. These applications, where opinions about various subjects are shared, provide resources for many research areas due to the amount of data they contain. For example, organizations' market analysis of their product and determining opinion of public about the government's works are among researches are done. Even though social media application provides rich data content, they have a lot of challenges. Most of the electronic documents that were produced don't obey syntactic and spelling rules. Emoticons, abbreviations and slang words which are contained by documents prevent to obtain useful information. The biggest challenge in extracting information is that documents are very short. All challenges that are listed make document analysis more complex. In this thesis ensemble learning model is proposed to overcome the challenges that mentioned. A glossary was used to correct spelling errors and abbreviations in documents. Required document space for proposed model is extended with BabelNet which is a semantic network. Three different datasets are derived from enriched document space were used to establish ensemble learning model. At the end of the thesis, the procedures and the results of the ensemble learning model are examined. | en_US |
dc.language | Turkish | |
dc.language.iso | tr | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | Babelnet ile zenginleştirilen twıtter doküman uzayında duygu analizi için işbirlikçi model kurulması | |
dc.title.alternative | An ensemble model using a babelnet enriched document space for twitter sentiment classification | |
dc.type | masterThesis | |
dc.date.updated | 2020-02-24 | |
dc.contributor.department | Bilgisayar Mühendisliği Anabilim Dalı | |
dc.identifier.yokid | 10289333 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | KOCAELİ ÜNİVERSİTESİ | |
dc.identifier.thesisid | 611456 | |
dc.description.pages | 83 | |
dc.publisher.discipline | Diğer |