Кыргыз текст корпустарынын негизинде гипертексттик-көрсөткүч сөздүгүнтүзүү(романдык жанр тексти)
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Кыргыз тилинин роман корпусун чогултуу жана анын негизиндегипертексттик-көрсөткүч сөздүгүн түзүү. Иштин жыйынтыгында корпусубуздатогуз роман чогултулду. Бул романдарга жалпы жана өзүнчө статистикаларжүргүзүлдү. Ал статистикалар график түрүндө көрсөтүлдү. Буга кошумчаромандагы сөздөрдүн узундуктарына жараша иреттелди. Романдын активдүү жанапассивдүү сөздөрү табылды.Бул жумуш төрт этаптуу болуп пландаштырылган. Биринчи этаптакорпусубузга керектелчү роман жанрындагы материалдарды топтолду. Экинчиэтапта топтолгон материалдарды белгилүү бир стилге келтирилди жана аларберилиштер базасына жүктөлдү. Ал эми үчүнчү этапта даяр болгон корпусубуздукөрүү жана анын үстүндө иш алып баруу үчүн программдык жабдык түзүүлдү.Соңку этапта, бул илимий изилдөө бүткөндөн кийин дагы бул жумуштун уланыпкетүүсүн камсыз кылуу үчүн корпусту толтуруу проблемасын автоматташтыруу.Башкача айтканда, менден башка адам дагы колунда электрондук роман болсо, аныкорпуска киргизүү мүмкүнчүлүгүн түзүү жана үчүнчү этапта жасалганпрограммдык жабдык ал романды да иштетүүсү.Иштин жыйынтыктары тил үйрөтүүдө же тил сферасында иштегендерүчүн тилди анализдөөдө, компьютердик криптографияда колдонулат. Эң кызыгы,изилдөөнүн жыйынтыктарын карап, аларды салыштырып, ошол романды жазганавтордун качалык деңгээлде сөз байлыгынын көптүгүн жана ал автордун сөздөрдүтүзүү стилин аныктасак болот. xЖыйынтыктын негизинде кыргыз тилиндеги роман жанрында эң көпколдонулган жана сейрек колдонулган сөздөрдү аныктап чыктык. Сейрекколдонулган сөздөрдүн ичинде эскирип кеткен эе болбосо колдонууда чыгыпкеткен сөздөрдү кездештирдик. Романдарды изилдеп жатып, жазылган заманынакарата ошол учурдагы эң көп колдонулган сөздөрдү да аныктасак болот. Азыркыжазылган романдар менен жыйырманчы кылымдын башында жазылганромандардын сөздөрүнүн ортосундагы ат менен жердей айырмасын байкасакболот. Эгемендүү болгуча жазылган романдардын ичинде совет бийлигинебайланыштуу көп сөздөрдү жолуктурсак болот. Ал эми азыркы учурда жазылганромандарда андай сөздөр сейрек кездешет. Бул бизге тилдин өнүгүүсүн же болбосоөзгөрүшүн көрсөтөт.Жумуштун жыйынтыгында кыргыз корпусунда кайсы тамгалар кандайжыштыкта колдонулгандыгы тууралу да маалымат алынды. Бул маалымат мененкошо тамгалардын айкалыштарынын таблицалары келтирилди. Бул жыйынтыктаркыргыз тилинин клавиатурасын жасаоодо керектелет. Учурда кыргыз романдарынжазуу үчүн жогорудагы жыйынтыктардын негизинде клавиатура жасаса болот.Жада калса ар бир роман үчүн өзүнчө кылып чыгарса болот.Бул илимий изилдөөнүн жыйынтыктарын азыркы учурда http://corpuskr.tkинтернет баракчасынан тапсаңыздар болот. Ал эми бул сөздүктөрдү өзкомпьютериңизден иштеткиңиз келсе, атайын DESKTOP түрүндөгү жасалганпрограммдык жабдыкты CD форматында жибере алабыз. Анын үчүнi.adilets@gmail.com адресине электрондук кат, анын ичинде эмне максаттаколдоноруңузду кошо жазууну өтүнөбүз.Aчкыч сѳздѳр: сөздүк; роман; жыштык;статистика;кыргыз тили. Bu çalışma roman türü metinden oluşan frekans sözlüğün ve o metinlerinözellkleri analiz edilir. Toplom olarak bu çalışmanın sonucunda 9 roman üzerinde çeşitliistatistik hesaplamalar yapıldı. Kırgız dilin oluşturan ramanların listesi aşadaki lıstedengörebilirsiniz.Tezde kırgız dilinde yazılan yoksa kırgız diline çevirilen dokuz romanıkullandım:• `Айта бар менин кебимди...` - Арслан Капай уулу• `Башы жок чабендес` - Майн Рид (amerikalı-ingilizceden kırgızcayaçevırılen)• `Борто Чөнө` - Ясаши Йинове (japon dilinen kırgızcaya çevırılen)• `Мартин Иден` - Жек Лондон (amerikalı-ingilizceden kırgızcayaçevırılen)• `Мисмилдирик (Бедел белиндеги каргыш)` - Койчиев Арслан• `Өмүр кызык` - Жек Лондон (amerikalı-ingilizceden kırgızcayaçevırılen)• `Сынган кылыч` – Төлөгөн Касымбеков• `Улуттун жоголгон байлыгы` - Медербек Адылбек уулу• `Хан Ормон` - Токтоналиев ЖапаркулBu romanların analizleri her türlü. Örneğin, tüm kırgızca yazılan roman ilekırgızcaya çevirilen romanların verileri bir az farklı gösterilir. Çevirilen romanlarda çok viişey çeviren insana bağımlıdır. Onunun yabancı dili ne kadar bilir ve sözleri ne kadarkullanabilldiğine bağımlı. En dooru statistiği sadece kırgızca yazılan romanlar gösterir.`Айта бар менин кебимди...` - kırgız dilinde yazılan tarihsel romandır. Buromanda kahraman ile vakittin kader oranı hakındadır. Sanat sözcüklerden oluşan buroman `Арча` edebiyat odülünün sahibidir. Roman PDF formatında http://bizdin.kgsitesinde serbest dağıtılır.`Борто Чөнө` – japon dilinen kırgız diline çevirilen tarihsel romandır. Buromanda Cengiz hanın biyografisi hakında, hayatında neleri yaptığını, nerde olduğunu,kimler ile olduğunu tanımlar. Roman PDF formatında http://bizdin.kg sitesinde serbestdağıtılır.Tezde hipermetin sözlük dizisini oluşturmak için gerekli olan materyaller veonları gerekli olan hale getirme aşamaları gösterilir. Romanları veri tabana saklamaişlemi, Java programlama dili ve JavaFX teknolojisi yardımıyla metinleri paragraflara vekelimelere paylaşma süreci adım adım anlatılır. Çeşitli istatistik verilerin bilgisayarüzerinden nasıl üretildiğini görebiliriz. İstatistik iki çeşit kaynak üzerinden hesaplanır:• Metin üzerinden• Sözlük üzerinden (benzersiz kelimeleri içeren)Romanları işaretleme - tezin en uzun vakit süren işlemidir. Her roman MS Word2010 ortamına getirilecek şekilde saklanması gerekir. Bu ortam hepimize belli veyazımda ortak olduğu için seçilmiş. JavaFX teknolojisi ile üretilen yazılım MS Worddokümanını okuyabilir. Okuduğu zaman paragrafları dört stile göre bölecek(MS Wordprogramın içindeki stiller):• 1. stil romanın adını belirleyecek• 2. stil romanın bir bölümün belirleyecek• 3. stil romanın herhangi bölümünün alt bölümün belirleyecek• 4. stil ise genel metin stili olacakHer romanı 1. stildeki metin ile başlayacaktır. Ondan sonra her hangi birbölüm'ün adı gider. Bölüm adın'dan sonra alt bölüm'ün adı ve o alt bölüme ait olan bütün
Collections