Fully automatic annotation of web service descriptions
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Web Servis (WS) birleşimi ve madenciliği gibi alanlarda bir takım önemli işlevlerin otomatize edilebilmesi için WS tanımlarına eklenmek üzere anlamsal bir katmanın oluşturulması gereklidir. Bu nedenle, son yıllarda böylesine bir katmanı tanımlayan ya da bu tarz bir katmanı kullanan bir çok çalışma gerçekleştirilmiştir. Bu çalışmaların düzgün bir şekilde test edilebilmeleri için, ilgili çalışmalar, anlamsal WS tanımlarından oluşan, koleksiyon formundaki uygun bir kalite testine tabi tutulmalıdırlar. Ancak erişilebilir haldeki bu türden tüm koleksiyonlar, büyüklük ve gerçeklik bağlamında kısıtlıdırlar. Bu da güvenilebilir sonuçlar elde etmeyi engelleyici bir faktördür. Öte yandan, büyük ve halihazırda kullanılmakta olan, ancak anlamsal katman içermeyen koleksiyonlar (WSDL) da mevcuttur. Uygun bir kalite testi ortamı oluşturulması bu koleksiyonların anlamlandırılması ile de mümkün olabilir. Ancak koleksiyonların büyük olmasından ötürü yapılması gereken anlamlandırma işini elle gerçekleştirmek hem zaman hem de çaba yönünden çok maliyetli olmaktadır. Bu çalışmada, buradan yola çıkarak geliştirdiğimiz büyük WS koleksiyonlarının tam otomatik anlamlandırılmasını sağlayan MATAWS isimli aracımızı tanıtıyoruz. Aracımız WS tanımlarında potansiyel anlamlandırılabilecek olan parametre isimlerinden, veri tipi isimlerinden ve yapılardan faydalanmaktadır. Anlamlandırma, kelimelere hiyerarşik bir yapıdan kavram ilişkilendirme şeklinde olup, bu iş WordNet'ten SUMO ontolojisine eşlenmiş Sigma tarafından gerçekleştirilmektedir. MATAWS'ın tasarım süreci ASSAM Full Dataset isimli bir WS koleksiyonunun özellikleri baz alınarak ilerletilmiştir. Bu koleksiyon, araştırmalarımıza göre halihazırda kullanılan WS tanımlarından oluşan en büyük WS koleksiyonudur. Anlamlandırma yöntemimizi detaylı bir şekilde tanımladıktan sonra, yöntemi bu koleksiyona uyguladık ve verimliliğini değerlendirdik. Ayrıca MATAWS'ı halihazırda kullanılan WS tanımlarından oluşan ve kendimizin oluşturduğu bir başka koleksiyona daha uygulayıp sonuçları değerlendirdik, böylece aracımızın geliştirilirken baz aldığı koleksiyon haricinde, yeni ve bağımsız koleksiyonlar karşısındaki davranışını ve verimliliğini inceledik.Anahtar Sözcükler: Web Servis, Semantik Web, Anlamlandırma, Ontoloji, WSDL, OWL-S, SUMO, WordNet. The definition and use of a semantic layer in Web Services (WS) descriptions is a prerequisite to the automation of several important operations such as WS composition and mining. For this reason, in the past years, many approaches have been proposed to either represent such high level information, or take advantage of it. In order to be properly tested and compared, these tools must be applied to an appropriate benchmark, taking the form of a collection of semantic WS descriptions. However, all of the existing publicly available collections are limited in terms of size or realism, leading to unreliable results. Large real-world syntactic (WSDL) collections exist, so an appropriate benchmark could be obtained through their semantic annotation. Due to the number of operations to process, performing this task manually would be costly in terms of time and efforts, though. A better solution would therefore be to use an automatic tool. With this motivation, in this work we propose a new fully automatic semantic annotation tool, called MATAWS, designed to process WS descriptions. The resulting tool takes advantage of the latent semantics present not only in the parameter names, but also in the data type names and structures. Concept-to-word association is performed by using Sigma, a mapping of WordNet to the SUMO ontology. The design of MATAWS is data-driven, based on the properties of ASSAM Full Dataset, the largest collection of real-world syntactic WS descriptions we could find. After having described in details our annotation method, we apply it to this collection and assess its efficiency. We also apply and evaluate MATAWS on another WS collection prepared by ourselves, in order to prove our tool performs well on new, independent data.Keywords: Web Service, Semantic Web, Semantic Annotation, Ontology, WSDL, OWL-S, SUMO, WordNet.
Collections