Show simple item record

dc.contributor.advisorOrdin, Burak
dc.contributor.authorNasibov, Elvin
dc.date.accessioned2020-12-29T08:42:07Z
dc.date.available2020-12-29T08:42:07Z
dc.date.submitted2017
dc.date.issued2020-11-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/369588
dc.description.abstractVeri madenciliği yöntemlerinden biri olan Kümeleme Analizi, verilerin özelliklerini göz önüne alarak, birbirleri ile benzer olan verileri alt kümelere ayırmayı sağlayan çok boyutlu veri analiz yöntemidir. Kümeleme analizi yöntemleri, kümelenecek verilerin boyutu, ortamı ve özellikle de türüne göre çeşitlilik göstermektedir.Kümeleme analizinde kullanılan veri setleri, çeşitli yöntemlerle toplanan verilerin özelliklerini içermektedir. Toplanan veriler hesaplanabilir nümerik değerlerle beraber, üzerinde matemetiksel işlemlerin kısıtlı yapılabildiği kategorik özellikler de içermektedir.Bu tezde, hem nümerik, hem kategorik veriler içeren veri setleri için kümeleme algoritmaları ve onların geliştirilmiş versiyonları incelenmiştir. Literatürde yer alan algoritmaların lokal minimumlarda iyi sonuçlar vermesine karşılık global çözümler için yeterli olmaması nedeniyle, kümeleme analizi probleminin global çözümü için artımlı ve karma veriler ile çalışan yeni bir algoritma önerilmiştir. Önerilen artımlı yöntem C# dilinde MS SQL Server Veri Tabanı Yönetim Sistemi imkanları kullanılarak programlanıp, 16 gerçek veri seti üzerinde hesaplama denemeleri yapılmıştır. Önerilen algoritma k-Prototypes algoritması ile kıyaslandığında yöntemin yararlılığı açıkça gösterilmiştir.
dc.description.abstractThe Clustering Analysis is one of the main techniques of data mining and it is also the method of analysis of multidimensional databases which divides the data set into clusters based on the similarity of data points. Clustering analysis methods vary according to the size, environment and especially the type of data to be aggregated.Data sets used in the clustering analysis contain the characteristics of data gathering and giving in various ways collected data features include computable numerical values as well as categorical attributes on which mathematical operations can be restricted.In this thesis, exact clustering algorithms for data sets containing both numerical and categorical data and their improved versions are investigated. Since existing algorithms provide good results at local minimums but are not sufficient for global solutions, a new algorithm for global solution of cluster analysis problem, working with incremental and mixed data, has been proposed. The proposed incremental method is programmed in C# language using MS SQL Server Database Management System facilities and calculation experiments are performed on 16 real data sets. The proposed algorithm clearly shows the usefulness of the method when compared to the k-Prototypes algorithm.en_US
dc.languageTurkish
dc.language.isotr
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.subjectMatematiktr_TR
dc.subjectMathematicsen_US
dc.titleKarma veriler üzerinde etkin kümeleme algoritmalarının geliştirilmesi
dc.title.alternativeDevelopment of effective clustering algorithms on mixed data
dc.typedoctoralThesis
dc.date.updated2020-11-06
dc.contributor.departmentMatematik Anabilim Dalı
dc.identifier.yokid10169283
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityEGE ÜNİVERSİTESİ
dc.identifier.thesisid479796
dc.description.pages118
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess