FPGA implementation of a dense optical flow algorithm using altera OpenCL SDK
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Yoğun hesaplama gerektiren algoritmaların FPGA üzerinde geliştirilmesi, gerektirdikleriuzun Verilog veya VHDL RTL tasarım sürelerinden ötürü genellikle çok makuldeğildir. Paralel hesaplama yapılınabilir algoritmaların hız için alternatif bir platformuvardır: GPU. GPU programlama için CUDA ve OpenCL dilleri yaygın şekildekullanılmaktadır. OpenCL çoğu çok çekirdekli işlemci ve çoğu GPU'ya taşınabilir olmasınedeniyle bir çok programcının seçeneğidir. FPGA'ler için OpenCL SDK veYüksek Seviyeli Sentez (YSS) genel olarak FPGA hızlandırmasını gerçekten mümkünkılmaktadır. Paralel programlanabilir uygulamalarda, geleneksel YSS'ye göre OpenCLtabanlı sentez tercih edilir çünkü sonuç hem GPU'ları hem de FPGA'leri sorunsuzbir şekilde hedef alabilir. Bu tezde, yoğun hesaplama gerektiren bir optik akış algoritmasını OpenCL kullanarak yüksek düzey bir GPU'da ve yüksek düzey bir FPGA'deçalıştırarak ulaşılan sonuçlar paylaşılmıştır. Her iki platformda da hız ve güç tüketimisonuçları sunulmuştur. FPGA acceleration of compute-intensive algorithms is usually not regarded feasible because of the long Verilog or VHDL RTL design efforts they require. Data-parallel algorithms have an alternative platform for acceleration, namely, GPU. Two languages are widely used for GPU programming, CUDA and OpenCL. OpenCL is the choice of many coders due to its portability to most multi-core CPUs and most GPUs. OpenCL SDK for FPGAs and High-Level Synthesis (HLS) in general make FPGA acceleration truly feasible. In data-parallel applications, OpenCL based synthesis is preferred over traditional HLS as it can be seamlessly targeted to both GPUs and FPGAs. This thesis shares our experiences in targeting a demanding optical flow algorithm to a high-end FPGA as well as a high-end GPU using OpenCL. Throughput and power consumption results on both platforms are presented.
Collections