dc.description.abstract | ÖZET Tutanak yapılaştırmanın amacı, ikincil bellekteki verilere fiziksel erişim istemlerinin en düşük düzeyde tutulmasını ve bu erişimlerde en az miktarda geçersiz verinin transfer edilmesini sağlayacak şekilde veri tabanını fiziksel olarak düzenlemektir. Bu işlemi gerçekleştirmede kullanılan teknikler, fiziksel düzenlemeyi eniyilemeyi hedefler. Bu çalışmada, öncelikle, bir veri tabanı dizgesinde etkin tutanak yapılarının seçilmesi ve ikincil belleğe fiziksel erişim isteklerini enküçüklemeyi hedefleyen tutanak yerleştirme problemi üzerinde durulmuştur. Bilgisayar destekli bilişim dizgeleri, büyük kuruluşların yönetim ve işletmesinde büyük önem taşırlar. Çoğunlukla böyle dizgeler, milyarlarca karakter bilgiyi içeren veri tabanları üzerinde çalışır ve değişen bilgi ihtiyaçları ile kullanıcılara hizmet üretirler. Bu dizgelerin etkinliği, büyük oranda, veri tabanı tasarımına bağlıdır. Maalesef, etkin bir veri tabanı tasarımı seçmek de güç bir iştir. Pekçok karmaşık ve birbiriyle ilişkili faktör göz önüne alınmak zorundadır. Veri tabanının desteklemesi gereken uygulamaların düzeyi yükseldikçe, tasarım işlemi de güçleşmektedir. Veri tabanı tasarımının önemli problemlerinden biri, ikincil bellekteki verinin, kullanıcıların bilgi 92erişim istemlerini etkin olarak karşılayacak bir şekilde fiziksel olarak nasıl düzenleneceğidir. Etkin bir fiziksel veri tabanı tasarımı kullanıcıların erişim istekleri dikkate alınarak, ikincil bellekteki veri düzenlenerek başarılır. Genel olarak, beraber istenen veri, fiziksel olarak beraber depolanır ve erişilir. Böylece kullanıcıların istemleri, ikincil belleğe enaz sayıda erişim ve enaz sayıda geçersiz veri transfer edilerek karşılanır. İlk olarak, düz dütük ortamında veri tabanı tutanaklarını bölümlemek için üç yaklaşım tartışılmıştır. Tutanak bölümleme problemi, veri tabanının bütün kullanıcıları için performansı eniyileyecek bölümlere bilgi alanlarının atanmasını belirlemektir. Matematiksel kümeleme, gruplama düzenlemesi ve çift kriterli programlama incelenen yaklaşımlardır. Veri erişim yöntemleri, modellenen ikincil bellek ortamı olarak tanınan farklı tutanak yapıları, bu seçeneklerin değerlendirme kriterleri ve kullanım algoritmaları açısından farklılıklar gösterirler. üzerinde durulan diğer konu ise, tutanak yerleştirme problemi ile ilgilidir. Sıklıkla beraber erişilen, mantıksal olarak birbirleriyle ilişkili tutanak türlerini kümeler halinde gruplamak ve bunları aynı sayfalara depolamaktır. Bu işlem, tutanak kümeleme problemi olarak adlandırılır. Bu kümelerden sıklıkla beraber 93kullanılanları, fiziksel olarak bellek bloklarına mümkün olduğunca yakın yerleştirmek ise küme yerleşim planı problemi olarak adlandırılır. Veri tabanı tutanak yerleştirme problem, bu iki problemle tanımlanır. Bu çalışmada, öncelikle, toplam işletim maliyetinin enkücüklenebilmesi için, hangi bilgi alanlarının fiziksel olarak birarada saklanması gerektiği üzerinde durulmuştur. Çözüm, verinin iç yapısına, büyüyebilirliğine, kullanıcı erişim istekleri ve bilgisayar dizgesi ortamının özelliklerine ve veri tabanı içerisinde erişim yollarının seçimine bağlıdır. Tutanak yapılaştırmasının iki yönü ele alınmıştır:.. Tutanak bölümleme.. Tutanak kümeleme Matematiksel kümeleme yaklaşımı, veri birimlerinin başlangıç gruplarını oluşturacak şekilde yorumlanacak olan bir benzerlik matrisi üretir. Gruplama düzenlemesi yordamı, tekrarlanan işlemlerle, önceden çiftler halinde belirlenmiş veri birimi gruplarını yeniden gruplar. Daha fazla verimlilik sağlamak üzere değerlendirir. Matematiksel programlama yaklaşımı, problemi çift kriterli matematiksel bir program olarak oluşturup klasik yöneylem teknikleri kullanarak çözer. Saklama ve transfer maliyetlerine oranla, faydalılık düzeyleri yüksek olan veri birimleri kümesini diğerlerinden ayırır. Nevar ki birincil ve ikincil olarak işlem gören iki bölümden daha 94fazlasını kullanamaz. Tutanak yerleştirimine ilişkin tartışılan teknikler, tutanakların kümelemelerini eniyileyebilmelerine karşılık, küme yerleşim planlamasında yetersiz oldukları gözlenmiştir. İleride yapılacak araştırmalar için, herbiri yukarıdaki tekniklerin zayıf yönlerinden kaynaklanmış birkaç araştırma sahası verilebilir. Veri yinelemesi, günleme işlemlerinin etkilerinin belirlenmesi, yedekleme ve kurtarma yordamları, veri güvenliği ve bölümleme ile kümelemeyi beraber içeren bir model sözkonusu olan sahalardır. SUMMARY The purpose of record structuring is to organize the physical database in order to keep the physical access requirements from the secondary storage at a minumum and to minimize the transfer of redundant data. The various techniques used in this process aim the optimization of the physical organization. The main area of concentration in this research is the selection of effective record structures in a database system in order to bring a solution to the problem of record placement in a way which optimizes the meeting of requirements of physical access to the secondary memory. Computer Based Information Systems have great 95 | |
dc.description.abstract | fazlasını kullanamaz. Tutanak yerleştirimine ilişkin tartışılan teknikler, tutanakların kümelemelerini eniyileyebilmelerine karşılık, küme yerleşim planlamasında yetersiz oldukları gözlenmiştir. İleride yapılacak araştırmalar için, herbiri yukarıdaki tekniklerin zayıf yönlerinden kaynaklanmış birkaç araştırma sahası verilebilir. Veri yinelemesi, günleme işlemlerinin etkilerinin belirlenmesi, yedekleme ve kurtarma yordamları, veri güvenliği ve bölümleme ile kümelemeyi beraber içeren bir model sözkonusu olan sahalardır. SUMMARY The purpose of record structuring is to organize the physical database in order to keep the physical access requirements from the secondary storage at a minumum and to minimize the transfer of redundant data. The various techniques used in this process aim the optimization of the physical organization. The main area of concentration in this research is the selection of effective record structures in a database system in order to bring a solution to the problem of record placement in a way which optimizes the meeting of requirements of physical access to the secondary memory. Computer Based Information Systems have great 95importance in the management and the organization of large corporations. Such systems usually consist of billions of characters information in their databases and provide service to changing user requirements. The effectiveness of these systems depend on their database design to a large extent. Unfortunately» the selection of an effective database design is not an easy task. Many complex and interrelated factors have to be taken into consideration. As the level of application supported by the database gets higher the design process gets more complicated. One of the major problems of database design is how to physically organize the data in the secondary memory in such a way that the data access requirements of the user community can be effectively met. An effective physical database design can be accomplished by considering the user access requirements and organizing data in the secondary memory. In general» the data which is required together is physically stored and thus accessed together. So the user requirements can be met with the minimum number of accesses to the secondary memory and a minimum tranfer of redundant data. Three approches for the segmentation of database records in a flat file environment are firstly discussed. The problem of record segmentation is the specifying the allocation of data items into segments in a way that <?6optimizes the performance for the overall users of the database. Mathematical clustering, grouping organization and bicriterial programming are the approaches which are considered. The data access methods differ according to the different record structures defined under the modelled secondary memory environment. The other subject is about record placement problem. The record clustering problem is to group record types which are to be accessed together frequently and which are logically related, and to store these in the same segments. Of this cluster ings, the ones which are frequently used together are to be placed physically into memory blocks which are as close to each other as possible. This is namely the clustering layout problem. In general database record placement problem is defined with these two problems. In this research, a closer look is taken over which data items are to be physically stored together in order to minimize the total operating cost. The solution for the problem depends on the internal structure and expandability of data, access requirements of the user community, the environmental conditions of the computers systems and the selection of access paths in the database. Two aspects of record structuring are considered:.. Record segmentation.. Record clustering 97The mathematical clustering approach generates a similarity matrix which is to be interpreted to form initial groupings. The grouping organization procedure regroups the data item pairs which are previously grouped by repetitive processes. Then, it evaluates these to increase productivity. The mathematical programming approach solves the problem using the classical operating research techniques forming bicriterion mathematical program to solve the problem. It distinguishes the data item clustering which has a higher productivity level compared to the storage and transfer cost. However this approach can use only two segments as primary and secondary. Although the techniques which are discussed about the record placement can optimize the record clustering» they are usually insufficient in clustering layout. For further research, several areas can be suggested all emerging from the weak sides of the above techniques. Data occurences, specifications of the effects of updating processes» backup and recovery procedures, data security and a model including both clustering and segmentation are among possible research areas. 98 | en_US |