Adaptif 3 boyutlu-ayrık kosinüs dönüşümü ve istatistiksel analiz tabanlı referanssız video kalite değerlendirme modeli
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Doğal videoların video içeriğine bağlı olarak değişmeyen Ayrık Kosinüs Dönüşümü (AKD) alanında belirli bir düzenliliği vardır. Ancak gürültünün varlığı orijinal videoların doğallığının değiştirilmesine yol açar. Bu tezin arkasındaki fikir 3 Boyutlu Ayrık Kosinüs Dönüşümü (3B-AKD) alanındaki bozulmuş videodan bir dizi istatistiksel özellik çıkararak bu sapmayı tahmin etmek ve sonrasında bu özelliklerin ve video kalitesi ile ilgili öznel değerler arasındaki ilişkileri incelemektir. Önerilen modelin geliştirme aşamaları aşağıdaki noktalarda özetlenebilir: 1) Video dizileri, farklı boyut ve içeriklere sahip küplere uyarlanabilir bir şekilde bölünmüştür. Bölümleme sürecinde, İnsan Görsel Sistemi (İGS) özellikleri göz önünde bulundurulmuştur. 2) Bu küplere 3B-AKD alanında istatistiksel analiz gerçekleştirilmiştir. Bu analiz sonucunda, 3B-AKD katsayıları bozulmuş videoların uzay-zamansal özelliklerini içermektedir. Bu özelikler spektral davranış, enerji değişimi, uzay-zamansal frekans bantları arasındaki uzaklıklar ve DC değişimi şeklindedir. 3) Özellikler EPFL-PoliMi video veritabanından elde edilen öznel sonuçları ile doğrusal regresyon analizi yolu ile bağdaştırılmıştır. Önerilen Referanssız-Video Kalitesi Değerlendirmesi (VKD) modelinin değerlendirme sonuçları, performansı içerik ve bozulmalara bağlı olarak düşebilen yüksek performanslı Referanssız-VKD metriklerinden farklı video içerik ve bozulmalarına sahip videolar için daha yüksek ve stabil performans gösterdiğini ifade etmektedir. Natural videos have certain regularity in the Discrete Cosine Transform (DCT) domain that does not vary depending on the video content. However, the presence of noise leads to modification of the naturalness of the original videos. The idea behind this thesis is to estimate this deviation by extracting a set of statistical properties from the distorted video in the 3 Dimensional Discrete Cosine Transform (3D-DCT) domain and then studying the relations between the values of these features and the subjective values related to the video quality. The development phases of the proposed model can be summarized in the following points: 1) The video sequences are segmented adaptively into cubes with different sizes and contents. In the partition process, the Human Vision System (HVS) properties are considered. 2) For these cubes a statistical analysis is conducted in the 3D-DCT domain. As a result of this analysis, the 3D-DCT coefficients contain the spatiotemporal features of the distorted videos. These features can be stated as spectral behavior, energy variation, distances between spatiotemporal frequency bands, and DC variation. 3) The features are associated with the subjective results obtained from the EPFL-PoliMi video database using the linear regression analysis. The evaluation results present that the proposed No Reference-Video Quality Assessment (NR-VQA) model achieves high and stable performance across the videos with different contents and distortions unlike many top-performing NR-VQA models whose performance may decrease depending on the contents and distortions.
Collections