İlişkisel ve NoSQL veri tabanı sistemlerinin performans karşılaştırması
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Dr. Edgar Frank Codd tarafından 1970 yılında yayınlanan `A Relational Model of Data for Large Shared Data Banks` adlı makale ile hiyerarşik veya gezinme yapısı yerine satır ve sütunlar içeren basit tablolar kullanan ilişkisel veri tabanlarını önerdiğinde mevcut hiyerarşik veya ağ veri tabanlarında işlemler yapmak çok zordu. Ara bir uygulama olmadan verilere erişmek gerektiği için, sorgulama yapan kişi işaretçiler(pointers) gibi karmaşık işlemler ile uğraşmak zorundaydı. Bu temel sorunlar ilişkisel veri tabanlarının ortaya çıkmasına neden oldu. Günümüzde akıllı telefonların artması, sosyal medya kullanımı, metin, görüntü, video, GPS ve Sensör verilerinin artması ile veri oluşumu şirketler için petabyte seviyelerine gelmiş ve veri türlerinin bir kısmı artık yapısal olmayan formatlarda oluşmaktadır. Google, Facebook ve Twitter gibi yüz milyonlarca insanın sürekli veri oluşturduğu bu platformların alt yapısında NoSQL veritabanları kullanılmaya başlanmıştır. Bu büyük şirketlerin önderliğinde keşfedilmeye başlanan NoSQL veri tabanları günümüzde birçok farklı veri tabanı modeliyle farklı amaçlarda kullanılmaktadır.Bu çalışmanın amacı: Yaklaşık 40 yıldır kullanılan ilişkisel veri tabanları ile günümüzde yaygınlaşmaya ve kullanılmaya başlanan NoSQL yani Big Data veri depolama sistemlerini performans açısından karşılaştırmak her iki kavramı da artıları ve eksileri ile ele almaktır.Diğer çalışmalardan farkı ilişkisel VTYS, Doküman tabanlı VTYS, Sütun tabanlı VTYS sistemlerinin aynı hacimdeki veri ile karşılaştırılmasıdır. Sonuç olarak toplu veri yazma, okuma, güncelleme işlemlerinde MongoDB VTYS, silme, gruplama işlemlerinde MySQL VTYS, tek tek yapılan işlemlerde Cassandra VTYS daha performanslı sonuçlar vermiştir. Cassandra VTYS'de toplu işlemlerde tekil alan koşulu zorunlu olduğundan toplu işlemlerde performans yönünden geri kalmıştır. MongoDB dinamik şema oluşturduğundan yazılımcı dostudur. It was very hard to process data in hierarchical and network databases up to aricle by Dr. Edgar Frank Codd in 1970, `Relational Model of Data for Large Shared Data Banks`. Dr. Edgar Frank suggestion was as follows a table system, composed of rows and columns, namely relational database systems.Some major problems caused to develop relational database systems, also without any secondary applications people can not access to data. Moreover some complicated processes like pointers needed to be used to acess the dataThe increase in number of smart phones and the use of social media, text, image, video GPS and also sensor data the production of data reached petabytes and also some of the data produced is not in relational anymore.Main aim of this study is as follows : The comparison of perfomance of relational databases which is used almost 40 years, and NoSQL databases, namely Big data storage systems, with all advantages and disadvantages.This study aims to compare all advantages and disadvantages of relational DBMS with Big Data storage systems , namely NoSQL DBMS performances.Relation based DBMS, Document based DBMS and Column based DBMS performance compared with same size of data, this the main difference of this study from previous ones. As a result MongoDB DBMS perfomed well in read, write, update processes, for software developers dynamical schema creation is more adequate. MySQL DBMS perfomed well in delete and group processes. Cassandra DBMS perfomed well in record base processes which is done one by one, moreover in bulk processes unique field requirement caused poor perfomance.
Collections