Show simple item record

dc.contributor.advisorYüret, Deniz
dc.contributor.authorMizrahi, Bengi
dc.date.accessioned2020-12-08T08:15:25Z
dc.date.available2020-12-08T08:15:25Z
dc.date.submitted2006
dc.date.issued2020-12-03
dc.identifier.urihttps://acikbilim.yok.gov.tr/handle/20.500.12812/171131
dc.description.abstractBir idafenin farklı sözcükler ve/veya grammer yapıları ile açıklanlamasına `açımlama' denir.Buna bir örnek şöyledir: ?Ali problemi çözdü.? ve ?Ali probleme çözüm buldu.? Bu tipaçımlamaları yakalayıp gruplamaya ise `açımlama çıkarma' denir. Açımlama veritabanlarıSoru Cevaplama Sistemleri, Metin Özetleme Sistemleri ve Otomatik Dil Çeviricileri için çokyararlı yapılardır. Örneğin, Soru Cevaplama Sistemleri soru yapısını farklı açımlamalar ileçoğaltıp anımsamasını yükseltebilir. Açımlama çıkarmak için ilk önce aynı olaydan bahsedenfarklı gazeteciler tarafından yazılmış farklı haber yazılarını eşleştiriyoruz. Daha sonra buhaber ikilileri içerisinde en çok benzeşen cümleleri yakalayıp eşleştiriyoruz. Son olarak bucümle ikililerinin içerisinde eşleşen açımlamalar bulmaya çalışıyoruz. Aynı olaydan bahsedenhaber yazıları bulma kesinlilik ortalamamız sıkı notlandırma ile 0.56, rahat notlandırma ile0.70. Cümle eşleme için 9 farklı ölçüm yöntemi denedik. Her ne kadar ortak kelime saymayöntemi, cümle eşlemede, ortalama n-gram kesinlilik ölçme yönteminden daha yüksekkesinlilik değerleri verdi ise de ikinci yöntem daha yararlı açımlamalar elde etti. Sadece doğruhaber ikileri ile sistem çalıştırıldığında 0.66 kesinlilik elde edildi.
dc.description.abstractDifferent expressions of the same statement is said to be paraphrases of each other. Anexample is the phrases 'solved' and 'found a solution to' in 'Alice solved the problem' and'Alice found a solution to the problem'. Paraphrase Extraction is the method of finding andgrouping such paraphrases from free text. Finding equivalent paraphrases and structures canbe very beneficial in a number of NLP applications, such as Question Answering, MachineTranslation, and Multi-text Summarization, e.g. in Question Answering, alternative questionscan be created using alternative paraphrases. We attack the problem by first grouping newsarticles that describe the same event and then collecting sentence pairs from these articles thatare semantically close to each other, and then finally extracting paraphrases out of thesesentence pairs to learn paraphrase structures. The precision of finding two equivalentdocuments turned out to be 0.56 and 0.70 on average, when matching criterion was strict andflexible, respectively. We tried 9 different evaluation techniques for sentence-level matching.Although, exact word match count approach had a better precision value than the n-gramprecision count approaches, paraphrase extraction phase shows that the latter approachescatch sentence pairs with higher quality pairs for paraphrase extraction. Our system canextract paraphrases with 0.66 precision when only equivalent document pairs are used as atest set.en_US
dc.languageEnglish
dc.language.isoen
dc.rightsinfo:eu-repo/semantics/embargoedAccess
dc.rightsAttribution 4.0 United Statestr_TR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectDilbilimtr_TR
dc.subjectLinguisticsen_US
dc.subjectMühendislik Bilimleritr_TR
dc.subjectEngineering Sciencesen_US
dc.titleParaphrase extraction from parallel news corpora
dc.title.alternativeParalel haber kaynaklarından eşanlamlı ifadeler ayıklama
dc.typemasterThesis
dc.date.updated2020-12-03
dc.contributor.departmentElektrik ve Bilgisayar Mühendisliği Anabilim Dalı
dc.identifier.yokid156203
dc.publisher.instituteFen Bilimleri Enstitüsü
dc.publisher.universityKOÇ ÜNİVERSİTESİ
dc.identifier.thesisid182092
dc.description.pages55
dc.publisher.disciplineDiğer


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

info:eu-repo/semantics/embargoedAccess
Except where otherwise noted, this item's license is described as info:eu-repo/semantics/embargoedAccess