A turkish database for psycholinguistic studies: A corpus based study on frequency, age of acquisition, and imageability

Tolgay, Elif Ahsen

View/Open

File_10071859 (530.3Kb)

Date

2015

Author

Tolgay, Elif Ahsen

Metadata

Show full item record

Abstract

Psikodilbilimsel veritabanları, bilimsel çalışmalarda kullanıma yönelik standardize edilmiş uyaran sağladıkları için araştırma açısından güvenilir ve kullanışlı kaynaklardır. Bu tezin hedefi Türkçe için psikodilbilimsel veritabanı geliştirmektir. Bu veritabanı nicel değişkenler (kelimelerin harf sayısı, vb) dışında üç değişken içerecektir: Kelime sıklık değeri, kelime edinim yaşı (KEY) ve imgelem değeri. Kelime sıklık değeri, tezin amacına yönelik olarak oluşturulmuş çocuk edebiyatı derlemi (ÇED) ve yetişkin dil kullanımını temsil eden internet tabanlı bir veritabanından (BOUN Derlemi) oluşan iki kaynaktan elde edilecektir. İmgelem değerleri, yetişkin katılımcılara uygulanacak bir anket yoluyla toplanacaktır.Bu tezdeki ana çalışma, KEY değerleri edinmekte kullanılacak iki farklı yöntemin karşılaştırılmasıdır: Yetişkin katılımcılara uygulanacak bir anketle oylanan KEY değeri toplamak; yetişkin ve çocuk dili derlemlerinden sıklık değerlerini karşılaştırmak. Öncelikle, ÇED'den edinilen sıklık değerleri ile çocuk konuşma kayıtlarından elde edilen sıklık değerleri karşılaştırılmıştır. Bu değerlerin pozitif korelasyon gösterdiği görüldüğünden dolayı, KEY değerlerini elde etmek için ÇED'in uygun bir kaynak olacağı sonucuna varılmıştır. Daha sonra, ÇED'den edinilen sıklık değerleri, yetişkin dil kullanımını temsil eden BOUN Derlemi'nden edinilen sıklık değerleriyle karşılaştırılmıştır. Her iki derlemden elde edilen sıklık değerleri, anket cevaplarından edinilen KEY değerleri ve imgelem değerleri Türkçe psikodilbilimsel veritabanı oluşturmak amacıyla bir araya getirilmiştir.

Psycholinguistic databases are reliable and practical sources for research purposes, since they provide standardized stimuli for scientific studies. The objective of the present thesis is to initiate a Turkish psycholinguistic database. Three variables are included in addition to quantitative variables (number of letters etc.): frequency, age-of-acquisition (AoA), and imageability. Frequency values are extracted from two sources; a child literature corpus (CLC) that is created for the purposes of the current thesis, and a web based corpus that represents adult language use (BOUN Corpus). Imageability ratings are collected from adult population with a questionnaire.The main research in the thesis is to compare two methods to obtain AoA values: to collect rated AoA with a questionnaire conducted on adult population, and to compare frequencies from adult and child language corpora. First, the frequency counts from CLC are compared to child speech frequencies. They seem to be correlated; therefore CLC is found to be a suitable source for acquisition data. Afterwards, frequency counts from CLC are compared to BOUN Corpus frequencies to obtain AoA data. The frequency values from both corpora, AoA values obtained from questionnaire, and imageability values are put together for the purpose of creating the Turkish psycholinguistic database.

URI

https://acikbilim.yok.gov.tr/handle/20.500.12812/225282

Collections

TEZLER

Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess