İnsan sesinden duygu tanıma
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
İnsanlar arasındaki en önemli iletişim aracı konuşmadır. Konuşma ile insanlar birbirlerine sadece düşüncelerini değil duygularını da aktarabilirler. Bunun yanı sıra insan sesi, parmak izi ve iris gibi biyometrik özellikleri de beraberinde taşıyabilmektedir. Konuşma ile karşımızdaki kişinin düşüncesini, duygusunu, cinsiyetini ve yaşını da tahmin edebilmekteyiz. İnsan sesi ve konuşması ile ilgili çalışmalar her ne kadar çok eski olsa da insan sesinden duygu analizi yeni bir araştırma alanıdır. Özellikle son 20 yıl içinde bu alanda çok önemli çalışmalar yapılmıştır. Bu çalışmalar başlangıçta sadece konuşmanın olumlu veya olumsuz olmasıyla ilgilenirken zamanla daha fazla duygu türleri çalışma kapsamına alınmış ve bu amaçla pek çok duygu veritabanı geliştirilmiştir. Bu çalışmada veritabanlarından en popüler olanı Berlin Emotional Database ve kendi veritabanımız olan EmoSTAR kullanılmıştır. İnsan-robot iletişiminde de duygu analizi önemli bir yer tutmaktadır ve gün geçtikçe daha ileri adımlar atılmaktadır. Önceleri konuşma sentezi yoluyla makinelerin insanlara konuşarak cevap vermeleri amaçlanmaktaydı. Bu çalışmalar oldukça başarılı olmuş ve ilk başlarda mekanik gözüken makine sesi artık insan sesine yakın bir doğallığa kavuşmuştur. Makine konuşmasındaki doğallığı daha ileri seviyelere taşımanın bir yoluda makine konuşmasına duygu ilave edebilmektir. Duygu tanıma çalışmaları konuşma ve konuşmacı tanıma ve sentez sistemlerinin geliştirilmesinde de faydalıdır. Human speech is the most important communication tool between humans. Humans express not only their thoughts with speech but they can also express their feelings. Human voice is a biometric tool like fingerprint or iris and can carry many information such as emotion, gender and even age. Although, the works on human speech date back more than 100 years ago emotion analysis is relatively a new research area. In the last 20 years very extensive researches have been conducted in this field. In the beginning only positive versus negative speech analysis were conducted but as technology matured, many emotion kinds have been added and many emotional databases have been developed for this purpose. In this work, one of the most popular of these databases Berlin Emotional Database was used together with EmoSTAR which is our own emotional speech corpus.
Collections