Measuring Wikipedia article quality by revision count
dc.contributor.advisor | Aytekin, Tevfik | |
dc.contributor.author | Bayik, Mustafa Utku | |
dc.date.accessioned | 2021-05-01T07:14:48Z | |
dc.date.available | 2021-05-01T07:14:48Z | |
dc.date.submitted | 2012 | |
dc.date.issued | 2018-08-06 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/550495 | |
dc.description.abstract | Wikipedia milyonlarca makale içeren ücretsiz bir ansiklopedidir. Makaleler bir çok kullanıcı tarafından ortaklaşa yazıldığı için makalelerde eşit bir kalite standardı bulunmamaktadır. Çok kaliteli makaleler olduğu gibi (örn., seçkin içerikli makaleler), kalitesiz ya da yeterli bilgi içermeyen makaleler de mevcuttur.Bu çalışmada makalelerin değişikliklik geçmişlerini inceleyerek kalitelerini değerlendirmeyi öneriyoruz. Kalite standardı olarak Wikipedia'daki seçkin içerikli makaleleri kullandık. Makalelerin değişiklik geçmişlerinden özellikler çıkararak, bilinen makina öğrenmesi yöntemleriyle makaleleri seçkin içerikli ve seçkin içerikli olmayan şeklinde sınıflamaya çalıştık. Wikipedia'daki makalelerden oluşturduğumuz bir veri seti üzerinde elde edilen deneysel sonuçlar göstermektedir ki geliştirdiğimiz yöntemle tatmin edici bir düzeyde sınıflama performansı elde edilebiliyor. Yeni özellikler çıkararak bu performansın daha da artırılabileceğini düşünüyoruz.Anahtar kelimeler: Wikipedia, Değişiklik Sayısı, Kalite Ölçme | |
dc.description.abstract | Wikipedia is a free encyclopedia which has millions of articles. Since articles are collaboratively edited by many users there is no standard in the quality of articles. Although there are articles which have high quality (such as featured articles), some articles have poor quality or insufficient information.In this work we propose to use monthly revision histories of articles in order to assess article quality. We use featured articles in Wikipedia as our standard for quality articles. We extract features from revision history of each article and try to classify articles as featured and non-featured using well-known machine learning algorithms. We achieve a satisfactory classification performance using our methodology as the experimental results on a Wikipedia article dataset that we create shows. We think that this performance is open to further improvement by extracting more features.Keywords: Wikipedia, Revision Count, Measuring Quality | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgi ve Belge Yönetimi | tr_TR |
dc.subject | Information and Records Management | en_US |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | Measuring Wikipedia article quality by revision count | |
dc.title.alternative | Değişiklik sayısına göre Wikipedia kalitesini ölçme | |
dc.type | masterThesis | |
dc.date.updated | 2018-08-06 | |
dc.contributor.department | Bilgisayar Mühendisliği Ana Bilim Dalı | |
dc.subject.ytm | Computer softwares | |
dc.subject.ytm | Quality measurement plan | |
dc.identifier.yokid | 434564 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | BAHÇEŞEHİR ÜNİVERSİTESİ | |
dc.identifier.thesisid | 341214 | |
dc.description.pages | 55 | |
dc.publisher.discipline | Diğer |