Hardware acceleration for multiple sequence alignment of proteins
dc.contributor.advisor | Başkaya, İsmail Faik | |
dc.contributor.author | Ateşpare, İbrahim | |
dc.date.accessioned | 2020-12-04T10:02:34Z | |
dc.date.available | 2020-12-04T10:02:34Z | |
dc.date.submitted | 2019 | |
dc.date.issued | 2019-12-30 | |
dc.identifier.uri | https://acikbilim.yok.gov.tr/handle/20.500.12812/72149 | |
dc.description.abstract | Uzun süredir aktif bir araştırma alanı olan Çoklu Dizi Hizalaması (MSA), biyoinformatik alanında kullanılan sayısal hesaplamaya dayalı bir yöntemdir. Proteinler için MSA, üç veya daha fazla amino asit dizisinin hizalanması işlemi anlamına gelmektedir. Bu işlemin çıktıları; homoloji aramaları, filogenetik analiz, protein yapısı tahmini gibi biyoinformatiğin başka alanları için girdi bilgilerini oluşturur. MSA için literatürdeki çözümler genel hatlarıyla üç gruba ayrılır: Doğrudan yaklaşım, gelişimsel yaklaşımlar ve yinelemeli yaklaşımlar. H4MSA, çok amaçlı eniyileme ve bir tür genetik algoritma içeren, mevcut yinelemeli yaklaşımlardan biridir. Bu çalışmada, MSA için bir donanım hızlandırması önerilmiş ve test algoritması olarak H4MSA kullanılmıştır. Hızlandırma, MSA uygulamalarında yaygın bir puanlama çeşidi olan ve ayrıca H4MSA algoritmasında bir amaç fonksiyonu olarak da kullanılan, ağırlıklı çiftler toplamı skoru (WSPS) hesabı için donanımsal bir yapı tasarlanarak geçekleştirilmiştir. Tüm uygulama, bir SOC (tek yonga üzerinde sistem) cihazı içine kurulmuş olup; cihazın FPGA bölümünde donanım bloğu inşa edilmiş ve test algoritması cihazın merkezi işlem biriminde (CPU) çalıştırılmıştır. Tasarımın testi için iyi bilinen bir veri tabanından 12 farklı dizi seti kullanılmış olup, sonuçlar donanımsal hızlandırılmış versiyonun, CPU versiyonuna oranla 1.7x ile 20x arasında hız artırımlarına ulaştığını göstermiştir. | |
dc.description.abstract | Multiple Sequence Alignment (MSA), which has been an active research area for a long time, is a computational task that is used in the field of bioinformatics. MSA for proteins involves the process of aligning three or more amino acid sequences. The outputs of this task provide further information for other areas in bioinformatics such as homology searches, phylogenetic analysis and protein structure prediction. The algorithmic solutions for MSA can mainly be split into three groups: Direct approach, progressive approaches and iterative approaches. H4MSA is one of the iterative approaches in the literature, that uses multi-objective optimization and a type of genetic algorithm (GA) to solve the MSA problem. In this work, a hardware acceleration is proposed for the MSA tasks and H4MSA is selected as the test algorithm. The acceleration is accomplished by designing a hardware block for the evaluation of weighted sum of pairs score (WSPS), which is a commonly used scoring function in MSA applications and also used as an objective function in the H4MSA algorithm. The entire application is built in a CYCLONE V SOC device, where the hardware is implemented in the FPGA fabric and the test algorithm is run on the CPU core of the device. For testing the design, 12 different sequence sets from a well-known database are used, and the results show that the accelerated version of the algorithm achieves speedups of 1.7x to 20x over the CPU version. | en_US |
dc.language | English | |
dc.language.iso | en | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.rights | Attribution 4.0 United States | tr_TR |
dc.rights.uri | https://creativecommons.org/licenses/by/4.0/ | |
dc.subject | Elektrik ve Elektronik Mühendisliği | tr_TR |
dc.subject | Electrical and Electronics Engineering | en_US |
dc.title | Hardware acceleration for multiple sequence alignment of proteins | |
dc.title.alternative | Proteinlerin çoklu dizi hizalaması için donanım hızlandırması | |
dc.type | masterThesis | |
dc.date.updated | 2019-12-30 | |
dc.contributor.department | Elektrik-Elektronik Mühendisliği Anabilim Dalı | |
dc.subject.ytm | FPGA | |
dc.subject.ytm | Bioinformatics | |
dc.identifier.yokid | 10284927 | |
dc.publisher.institute | Fen Bilimleri Enstitüsü | |
dc.publisher.university | BOĞAZİÇİ ÜNİVERSİTESİ | |
dc.identifier.thesisid | 598606 | |
dc.description.pages | 72 | |
dc.publisher.discipline | Diğer |