Web erişim kütüklerinin temizlenmesine yönelik yazılım geliştirme
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
İnternet ve bilgisayar sistemleri başta olmak üzere birçok sistem, üzerinde gerçekleştirilen işlemleri kayıt altına alırlar. Bu işlem, bir uçağın kara kutusunun gerçekleştirdiği işleve benzemektedir. Kara kutu, uçakta olan bitenle ilgili her aktiviteyi nasıl kayıt altına alıyorsa, bilişim sistemlerinde kullanılan çoğu önemli cihaz da üzerinde gerçekleştirilen işlemlerle ilgili izleri kayıt altına almaktadır. Kayıt altına alınan bu bilgiler web tabanlı saldırıların tespitinde, adli olayların aydınlatılmasında, adli bilişim süreçlerinde, elektronik ticaret sitelerinde kullanıcıların davranışlarına göre ürün sayfalarının yeniden yapılandırılmasında, web uygulamalarının performanslarının arttırılması gibi birçok konuda önemli bilgilerin çıkarılması için kullanılabilmektedir.Web sunucularında üretilen ve saklanan kütük dosyaları, sunucular üzerinde bulunan web sitelerine ait etkinliklerin takip edilmesine ve bu sitelerin çeşitli yönlerden analiz edilmesine yönelik birçok önemli veriler ihtiva etmektedir. Bu dosyaların boyutu sunucu trafiğinin yoğunluğuna göre farklılık gösterebilmektedir. Bu veriler, web sunucusu üzerindeki web sitelerini ziyaret eden kullanıcıların, web sayfalarına erişirken bıraktıkları örüntülerin yanı sıra, siteye üye olurken kullanıcının web formuna girmiş olduğu bilgileri ve arama motorlarına ait botların web sayfalarında dolaşırken bıraktıkları izlerden oluşmaktadır. Karmaşık, anlamsız ve boyutu büyük olabilen bu dosyaların içeriklerinde bulunan kayıt satırlarından anlamlı verilerin çıkarılabilmesi, web sitelerinin analiz edilmesi web madenciliği ile gerçekleştirilmektedir. Metin tabanlı bu karmaşık verilere, veri madenciliği yöntemleri uygulanarak web sitesi yöneticilerine, sitenin geliştirilebilmesi ve etkinliğinin yükseltilmesi için birçok yararlı ve anlamlı bilgiler sunulabilmektedir. Bu tez çalışmasının genel amacı, web sunucuları tarafından farklı biçimlerde saklanan web erişim kütüklerinin temizlenmesine yönelik uygun bir yazılım geliştirmektir. Ayrıca, geliştirilen bu yazılım ile temizlenen erişim kütüklerinden anlamlı bilgilerin elde edilmesine yönelik örüntü keşfi ve örüntü analizi yapılmıştır. Bu kapsamda, önemli istatistiki bilgiler ve saldırı tespiti çalışmaları yapılmıştır. Internet and computer systems, should be first to take into consideration, because recording all the operations received and issued. This process is similar to the one performed by the black box of a plane. As the black box of the plane saves all activities of each section, a computing device records all the operations performed by a system. By the help of this System, many web based attacks were discovered and eased the clarification on the e-commerce sites, so using an application like the presented one, will lead to an increased performance of the web application and the Access of the customers will be restricted for the reasons mentioned above.Produced and stored in the files of the web servers, the sites contain many important data that can be followed and analyzed. The size of these files may vary depending on the density of the traffic of the server. The data may contain a list of the users who visited the web site, as well as patterns of their access on the web pages or the information introduced by them in the search engine. All these data can be complex, meaningless and the contents of the files can be large. So, a significant amount of data can be analysis with web usage mining. Applying the web usage mining phases to log files provides to web site managers meaningful and useful information.The overall objective of this thesis is to understand how we can clean the access logs from the servers. Excepting this, we can discover how we can Access important patterns of the information and how to analyze them. In this context, we should analyze important statistical information and intrusion detections.
Collections