Genetik algoritma kullanarak cümle seçme yaklaşımı ile otomatik metin özetleme
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Dijital ortamda bulunan bilgiler çok büyük boyutlara ulaşmış durumdadır. Bu yüzden elde edilmek istenen bilgiye en hızlı ve verimli şekilde ulaşmak zorlaşmıştır. Bu nedenle metinlerin özetinin elde edilmesi ihtiyacı ortaya çıkmıştır.Bu çalışma, otomatik metin özetleme yaklaşımlarını, çalışmalarını, yazılımlarını, algoritmalarını ve metotlarını ortaya koyar. Otomatik metin özetleme genel olarak iki bölüme ayrılır. Bunlar çıkarımsal özetleme ve yorumlayarak özetlemedir. İlk olarak çıkarımsal özetlemede cümleler ve kelimeler bazı özelliklere göre puanlandırılır ve en yüksek puanlı cümleler seçilir. Kısaca metindeki en önemli cümleleri bulmaktır. İkinci olarak yorumlayarak özet çıkarmada ise cümleler ve kelimeler arasında anlamsal ilişkiler incelenir. İki yöntem arasındaki en önemli fark, yorumlayarak özet çıkarma yönteminde metinden bağımsız yeni kelimeler elde edilebilir.Bu tez çalışmasında Türkçe metinler için çıkarımsal özetleme yöntemi ile başarının artırımı amaçlanmıştır. Üç farklı yöntem denenmiş ve ölçümler yapılmıştır. Bunlar sabit puanlı değerlendirme, sezgisel olarak belirlenen rastgele puan aralıklı değerlendirme ve genel aralıklı rastgele puanlama ile yapılan değerlendirmedir. Üç yöntem için de çıkarımsal özetleme yönteminde genetik algoritma kullanılmıştır ve cümleler buna göre puanlandırılmıştır. İlk yöntemde cümlelere puan verirken sezgisel yöntem uygulanmıştır. İkinci yöntemde sezgisel yönteme bir puan aralığı ilave edilerek sonuca ulaşılmaya çalışılmıştır. Üçüncü ve son yöntemde ise puan aralığı genişletilerek 1 ile 100 arasında bir tamsayı aralığı belirlenmiş olup cümleler puanlandırılmıştır. Yapılan ölçümlerde başarının arttığı tespit edilmiştir. Giant information have been available on the digital environments. For this reason it has hard to get the information what you want to achieve it, fast and most efficiently. For this reason, the need to obtain a summary of the texts has emerged. This research presents automatic text summarizations' approaches, studies, software, algorithms, and methods. Automatic text summarization is generally divided into two systems. There are extraction based summarizations and abstraction based summarizations. Firstly, extractions summarization approach involves selecting sentences of high score from the document based on word and sentence features. In short, finding the most important sentences from text is performed. Secondly, it is examined the semantic relationships between words and sentences in abstraction approaches. The most important difference from the first approach, made semantic analysis of words and sentences afterward new words are obtained. In this study, we focus on an extractive text summarization system and we purpose to increase the success about this issue. We have tried 3 different methods and made measurements. We applied genetic algorithm methods and scored the sentences in all three methods. We have tried to get the highest scores. In the first methods we made the scoring of sentences heuristic methods. Secondly, we have determined the range of points in the heuristic method. In the third method, we set the range from 1 to 100. We gave random integer points in this range and have tested the system. We have identified an increasing success in the measurements made in 3 methods.
Collections