Görüntü çözünürlüğünün otomatik cinsiyet ve yaş sınıflandırmasındaki etkisinin analizi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Geçmişte yapılan bir çalışmada, yüz bölgesine ait görüntüler kullanılarak, görüntü çözünürlüğünün cinsiyet tespitindeki başarıma etkisi incelenmiş ve 3x2 gibi insan gözü için hiçbir şey ifade etmeyen görüntülerde bile cinsiyete ait bilgiler olduğu ortaya koyulmuştur. Bu çalışmadan yola çıkılarak, bu tez çalışmasında, düşük çözünürlüklü görüntülerde kişinin yaşına ait bilgi bulunup bulunmadığı sorusuna cevap aranmış, bu doğrultuda 2x1, 3x2, 6x5, 8x6, 11x9, 16x13, 22x18, 45x35, 90x72, 329x264 olmak üzere, deneyler on farklı çözünürlükte, piksel parlaklık değeri, Yerel İkili Örüntüler, Çok Bloklu Yerel İkili Örüntüler ve Gradyan Yönleri Histogramları olmak üzere dört farklı öznitelik ile tekrarlanarak yaş sınıflandırması yapılmış ve sonuçlar karşılaştırılmıştır. Deneylerde MORPH veri tabanı ve FG-NET Yaşlanma veri tabanı kullanılmıştır. MORPH veri tabanındaki görüntü sayısı çok fazla olduğundan ve bu durum deney sürelerini olumsuz olarak etkileyeceğinden, yaş aralığı ve cinsiyet oranı korunarak, görüntü sayısını %10'a düşürecek şekilde MORPH veri tabanının bir alt kümesi oluşturulmuş ve deneylerde bu alt küme kullanılmıştır. Deneylerde kullanılacak olan görüntüler, yüz tespiti, yüz bölgesinin kırpılması, göz orta noktalarının hizalanması, histogram eşitlenmesi gibi ön işlemlere tabi tutulmuştur. Sınıflandırma işleminde K-En Yakın Komşu ve Rastgele Orman sınıflandırıcıları kullanılmıştır. Deneyler öncelikle MORPH veri tabanına ait görüntülerde cinsiyet ve yaş ve sınıflandırması olarak ayrı ayrı gerçekleştirilmiştir. Başlangıçta yaş aralığı beş ayrık gruba bölünerek gerçekleştirilen deneyler, daha sonra daha gerçekçi yaş sınıflandırma senaryosu elde edebilmek amacıyla, ayrık yaş gruplarının birleştirilmesiyle oluşturulan iç içe yaş grupları kullanılarak tekrarlanmıştır. İç içe yaş gruplarının kullanılması daha gerçekçi sonuçlar verdiğinden, FG-NET veri tabanında yapılan deneyler sadece iç içe yaş grubu kullanılarak gerçekleştirilmiştir. Elde edilen deney sonuçları incelendiğinde, 11x9 gibi düşük çözünürlüklerde bile cinsiyet sınıflandırma için tatmin edici başarıma ulaşıldığı fakat cinsiyet sınıflandırmasından daha karmaşık bir problem olan yaş sınıflandırması için %59.8 başarımın MORPH veri tabanına ait görüntülerde, 90x72 çözünürlüğünde yakalandığı görülmüştür. FG-NET veri tabanına ait görüntülerde elde edilen başarım ise MORPH veri tabanından daha düşük olmak üzere maksimum %57.7 dir. K-En Yakın Komşu sınıflandırıcısında en yakın görüntüler aynı kişiye ait görüntüler olduğundan, Rastgele Orman sınıflandırıcı sonuçları dikkate alınmıştır. En yüksek başarımlar piksel parlaklık değeri ve Gradyan Yönleri Histogramları öznitelikleriyle elde edilmiştir. In previous work, the effect of image resolution for gender classification performance was analyzed using facial images. This work revealed even very low resolution images such as 3x2, carry useful information for gender detection. Inspired by this study, this thesis seeks an answer to the question of `Do low-resolution images carry some useful information for distinguishing between age groups?`. For this purpose, four different feature types namely pixel values, Local Binary Patterns, Multi-Block Local Binary Patterns and Histogram of Oriented Gradients were employed in the experiments where each experiment was repeated using ten different image resolutions including, 2x1, 3x2, 6x5, 8x6, 11x9, 16x13, 22x18, 45x35, 90x72, 329x264. Two popular facial datasets, MORPH and FG-NET Aging databases were used for the experiments. Since the large number of images in MOPRH database has negative effects on the duration of experiments, a subset of MORPH database preserving gender and age rates was used. Some preprocessing operations, e.g., face detection, cropping, aligning eye centers, histogram equalization were applied to the images prior to the classification process. K- Nearest Neigbor and Random Forests algorithms were employed separately for age and gender classifications. Age classification experiments were conducted on MORPH database using separate age groups first. The experiments were then repeated with nested age groups to employ more realistic age classification scenarios. Since nested age groups increased the success rate, such groups were used for FG-NET only. As a result, for gender classification, satisfying results were obtained even for low resolution images such as 11x9. Since age classification is harder and more complicated than that of gender, lower age classification success rates were obtained. For age classification, maximum 59.8% success rate for MORPH database and maximum 57.7% success rate for FG-NET database were recorded. K- Nearest Neighbor results are highly affected by the different image of the same persons. Hence, Random Forest results are taken to be more realistic. In terms of feature types, maximum success rates were obtained using pixel values and Histogram of Oriented Gradients.
Collections