Varlık bağlama sisteminin dizi öğrenme yöntemi ile bilgi tabanı kullanılarak geliştirilmesi
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Son zamanlardaki Toplu Varlık Bağlama çalışmaları genellikle, anlamsal gömme ve çizge tabanlı yaklaşımlar kullanarak aynı metinde yer alan tüm eşlenmiş varlıkların küresel tutarlılığını sağlamaya çalışmaktadır. Çizge tabanlı yaklaşımlarbaşarılı sonuçlar gösterse de dayandıkları genel veri kümeleri için hesaplama açısından uzun süreli yaklaşımlardır. Ayrıca, anlamsal gömmeye dayanan çalışmalar dizileri düşünmeden sadece varlık çiftleri arasındaki ilişkiyi dikkate almaktadır. Bu tez kapsamında, bahsedilen problemlerin üstesinden gelebilmek için iki aşamalı bir yapay sinir modeli kullanarak ele alınmaktadır. İlk olarak, kolay söz-varlık çiftlerini eşleştirip, daha yakın atıfa sahip aday varlıkları filtrelemek için bu çiftin alan bilgisi kullanılmaktadır. İkinci aşamada iki taraflı Uzun Kısa Süreli Bellek ve küresel varlık anlamsızlığı için dikkat mekanizması kullanarak daha fazla anlam karmaşıklığı olan atıf-varlık çiftleri çözülmektedir. Bu tez kapsamında önerilen sistem oluşturulan alana özgü değerlendirme veri kümelerinde modern teknoloji sistemlerden daha iyi performans göstermektedir. Recent collective Entity Linking studies usually promote global coherence of all the mapped entities in the same document by using semantic embeddings and graph-based approaches. Although graph-based approaches areshown to achieve remarkable results, they arecomputationally expensive for general datasets. Also, semantic embeddings only indicate relatedness between entity pairs without considering sequences. In this paper, we address these problems by introducing a two-fold neural model. First, we match easy mention-entity pairs and using the domain information of this pair to filter candidate entities of closer mentions. Second, we resolve more ambiguous pairs using bidirectional Long Short-Term Memory and attention mechanism for the global entity disambiguation. Our proposed system outperforms state-of-the-art systems on the generated domain-specific evaluation dataset.
Collections