Scalable Data Analytics using Spark
dc.contributor.advisor | Bulut, Ahmet | |
dc.contributor.author | Bakirov, Aslan | |
dc.date.accessioned | 2021-05-08T07:33:34Z | |
dc.date.available | 2021-05-08T07:33:34Z | |
dc.date.submitted | 2015 | |
dc.date.issued | 2018-08-06 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/631645 | |
dc.description.abstract | Bu tez çalışmasında Apache Spark ve Apache Hadoop platformları üzerinde ölçeklenebilir veri analitiği çalışılmıştır. Temel olarak üç tane temsili uygulama geliştirilmiştir: (1) Duygu Analizi, (2) İşbirliğine Dayalı Filtreleme ve (3) Konu Modellemesi. Bu uygulamaların 8 makinelik bir küme üzerinde ölçeklenebilirliği gösterilmiştir. Her makine hesaplama havuzuna 4 çekirdek, 8 GB RAM ve 100 GB disk alanı kadar katkıda bulunmuştur. GÖzlemlerimize göre, Apache Spark üretim ortamlarında güvenli bir şekilde kullanılabilir olgunluktadır. | |
dc.description.abstract | This thesis presents our experience in designing a scalable data analytics platform ontop of Apache Spark (major) and Apache Hadoop (minor). We worked on three repre-sentative applications: (1) Sentiment Analysis, (2) Collaborative Filtering and (3) TopicModeling. We demonstrated how to scale these applications on a cluster of 8 workers.Each worker contributes 4 cores, 8 GB RAM, and 100 GB of disk space to the com-pute pool. Our conclusion is that Apache Spark has enough maturity to be deployed inproduction comfortably. | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Bilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontrol | tr_TR |
dc.subject | Computer Engineering and Computer Science and Control | en_US |
dc.title | Scalable Data Analytics using Spark | |
dc.title.alternative | Spark kullanarak Ölçeklenebilir Veri Analitiği | |
dc.type | masterThesis | |
dc.date.updated | 2018-08-06 | |
dc.contributor.department | Elektronik ve Bilgisayar Mühendisliği Ana Bilim Dalı | |
dc.identifier.yokid | 10073538 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | İSTANBUL ŞEHİR ÜNİVERSİTESİ | |
dc.identifier.thesisid | 413235 | |
dc.description.pages | 36 | |
dc.publisher.discipline | Diğer |