Show simple item record

dc.contributor.advisorAcartürk, Cengiz
dc.contributor.authorAğin, Halil
dc.date.accessioned2020-12-10T09:13:02Z
dc.date.available2020-12-10T09:13:02Z
dc.date.submitted2015
dc.date.issued2018-08-06
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/225242
dc.description.abstractBu tez, metinsel tutarlılığı ölçmek için dağılımsal anlambilimini teorik çerçeve olarakkabül etmektedir. Dağılımsal anlambilimi söylem sekmelerini vektör olarak alır vevektör boyutlarını metindeki tekrarlı kelime sayılarından oluşturur. Bu sayede metininanlam darağacının oluşturulmasını sağlar. Metinsel tutarlılık bu vektörlerin cosinedeğerleri hesaplanarak ölçülür (Gizil Anlambilim analizi, LSA). Bu çalışmalardakiortak varsayım metin tutarlılığını ölçmek için metindeki tekrarlanan kelime frekanslarıbir kohezif ip ucu olarak kullanılabilir. Böylece, kelime-doküman matrisleritemelli analizlere kapı aralanmış olur. Bu tez, bir metinde ardışık cümlelerdeki tekrareden kelimelerden elde edilen kelime-mesafe matrisinin (kelime-doküman matrisininbir türevi) metin tutatlılığının ölç ümünde kullanılabileceğini ileri sürmektedir. Tez,do-küman-mesafe matrisinin elde edilebilmesi için 2 adet matematiksel fonksiyonve fonksiyonları kullanan 2 adet algoritma önermektedir. Matematiksel fonksiyonlardoküman-doküman matrisinden doküman-mesafe matrisini üretmek için kullanılmaktadır.Algoritmalar, yeni önerilen doküman-mesafe matrisi uzerinde işleyerek metinseltutarlılığı ölçmektedir.
dc.description.abstractThis thesis takes the distributional semantics (frequency-based semantics) approachas the theoretical framework to quantify textual coherence. Distributional semanticsdescribes discourse sections as vectors, having dimensions are the frequency count ofco-occurring words in the text within its semantic space. It quantifies the textual coherenceby measuring the cosine values of vectors of successive sentences (cf. LatentSemantic Analysis, LSA). The common assumption underlying LSA based studies isthat the frequency of word co-occurrence can be used as a cohesive cue to quantifytextual coherence, thus leading to analyses based on a term-document matrix. In thisthesis, the spatial distance of co-occurring words is considered as a new frequencyevent of cohesive cues and introduces a document-distance matrix, which is derivedfrom the term-document matrix. This thesis proposes that the matrix representationof document-distance (a derivation of term-document matrix) of co-occurring wordsin adjacent sentences in a text can be used to quantify textual coherence. Two mathematicalfunctions are suggested for deriving the document-distance matrix and twoalgorithms for the operations. The mathematical functions operate on the documentdocumentmatrix (a derivation of term-document matrix) to derive the documentdistancematrix. The algorithms measure the coherence of text by operating on thenewly introduced document-distance matrices.en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/openAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectBilgisayar Mühendisliği Bilimleri-Bilgisayar ve Kontroltr_TR
dc.subjectComputer Engineering and Computer Science and Controlen_US
dc.subjectDilbilimtr_TR
dc.subjectLinguisticsen_US
dc.titleAutomated coherence detection with term-distance pat extraction of the co-occurrence matrix of a document
dc.title.alternativeBir dokümanın tekrar matrisinin kelime-mesafe yolu çıkarımı ile otomatik metin tutarlılığı tespiti
dc.typemasterThesis
dc.date.updated2018-08-06
dc.contributor.departmentBilişsel Bilim Anabilim Dalı
dc.identifier.yokid10086305
dc.publisher.instituteEnformatik Enstitüsü
dc.publisher.universityORTA DOĞU TEKNİK ÜNİVERSİTESİ
dc.identifier.thesisid409159
dc.description.pages116
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/openAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/openAccess