Exploring the power of supervised learning methods for company name disambiguation in microblog posts
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Varlığın belirsizliğini giderme, varlığın içerik içerisinde asıl kastettiği varlığı bulma işlevidir. Varlığın belirsizlik problemi çeşitli nedenlerden dolayı meydana gelebilir.Örneğin, bu problem varlığın referans verilme çeşitliliğinden kaynaklanabilir. Ya da varlık için kullanılan kelimelerin belirsizliğinden kaynaklanabilir. Son olarak, bu belirsizlik hatalı yazılımlardan kaynaklanabilir. Şirket isimlerindeki belirsizlikler, şirket hakkında Web üzerinde bilgi araması yapılması söz konusu olduğunda önemli olabilir. Son zamanlarda, marka yönetimi için sosyal medyanın takip edilmesi pazarlama, yerel ilişkiler ve ürün pazarlamasında şirket hakkında adımların atılması noktasında önemli olmaktadır. Bu çalışmada Tweet metinleri üzerinde belirsizliği giderme problemi için farklı makine dili öğrenimi algoritmaları uyguladık. Çalışmamızda dikkatli seçilen özellik setleri ile, öğretici ile öğrenme tekniklerinin belirsizlik probleminin çözümünde katkı sağladığını gösterdik. Entity disambiguation is the task of identifying the real world entity that was referredto/mentioned in a context. Ambiguous references to entities may occur due to variationsof how an entity is referenced (BT, British Telecom) or inherent ambiguities of thenames used for entities (Orange Telecom vs. fruit orange), and misspellings (Best Buy vs.BestBuy). Ambiguities in company names however come with a price, when it comes tofinding information about the company on the Web. Recently, tracking social media forbrand management has become a very important part of the process in marketing, publicrelations, and product marketing. Therefore, resolving references to real world objectshas become an important part of social media analytics systems. In this thesis, we studydifferent machine learning algorithms for entity disambiguation in micro-blogging posts.We show that with the carefully selected set of features, supervised learning techniqueswould improve the disambiguation quality significantly.
Collections