Exploiting temporal query behavior for improving result cache accuracy in web search engines
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Arama motorları için kullanıcı sorgularına hızlı ve zamanında cevap verebilmekönemli bir gereksinimdir. Cevap zamanını iyilemek için yaygın olarak kullanılanılantemel tekniklerden biri cavap sayfalarının önbelleklenmesidir. Birçok farklı bilgiyihafıza gibi hızlı erişim yeteneğine sahip bir yapıda saklayarak önbellekler aramamotorlarına daha kabul edilebilir bir cevap zamanı elde etme olanağı sağlarlar.Kullanıcı sorgularının anonim ve küresel yapısından dolayı arama motorları yaygınolarak zamana bağlı olmayan yapılar olarak algılanmışlardır. Yani, ara motoru sitelerisürekli olarak kendilerine gönderilmiş olan dünyanın her yerinden gelen sorgularagün boyu cevap vermektedirler. Araştırmalarımız sırasında, bu fenomeni inceledir veveri merkezlerinin, yani bir arama motorunun altyapı taşlarının, yüksek seviyedesorgu zamansallığının etkisi altında kaldığını farkettik. Bu çalışmamızda amacımızsorgu zamansallığını kullanan yeni bir önbellek yapısı önermek ve bu şekildeönbellek başarısını artırmaktır. Bu amaçla en gelişkin teknoloji olarak kabul edilenStatik-Dinamik Önbellek (SDC) inceleyerek üzerine sorgu zamansallığını kullanandeğişiklikler önerdik. Yapılan deneyler önerdiğimiz önbellek yapısının önbellekcevaplama oranını %3 kadar artırdığını göstermektedir ki bu yapılabilecekmaksimum eniyilemenin neredeyse %25'ine denk gelmektedir. In Web Search Engines responding to the user queries in a timely fashion isan important requirement. One of the integral techniques to improve the responsetime of a search engine is caching. By storing different types of information in a fastaccess memory storage, caching achieves a higher availability and better responsetimes for the search engine.Due to anonymous and global access pattern of the queries, search engines are oftenconsidered timeless frameworks. That is, search engine sites constantly respond toqueries that are submitted all around the world at an almost constant pace throughoutthe day. During our studies, we evaluate this phenomenon and come to theconclusion that each of the data centers, which in cooperation form the generalinfrastructure of a general purpose search engine in fact realizes high levels of querytemporality. In this work, we aim to apply and exploit the temporal behavior of thesubmitted queries to improve the cache accuracy by proposing a new cachingarchitecture. To this end, we improved the state-of-the-art result caching frameworkStatic-Dynamic Cache (SDC) and modified it in order to incorporate querytemporality. Our experiments show that the proposed caching framework improvesthe hit rate of a result cache up to 3%, which is roughly 25% of the possible room forimprovement.
Collections