Havacılık sektöründe uçuş gecikmelerinin makine öğrenmesi temelli analizi ve tahmini
- Global styles
- Apa
- Bibtex
- Chicago Fullnote
- Help
Abstract
Dünyada artan hareketlilik havayolu ulaşımına olan talebi artırmıştır. Yolcu taşımacılığının yanı sıra yükte hafif pahada ağır olarak tanımlanabilecek malzeme ve ürünlerin taşımacılığı konusunda da havayolu taşımacılığının payı günden güne artmaktadır. Yıllar içerisinde hem yolcu hem de yük taşımacılığı konusunda artan talep nedeniyle uçuş gecikmeleri artmış ve bu durum paydaşlar üzerinde olumsuz etkisi yaratmıştır. Gecikmelerin son ana kadar öngörülememesi havaalanlarında yığılma, bazı yolcular için uzun süreli bekleme veya aktarmalı uçuşları kaçırma gibi birçok problemi beraberinde getirmektedir. Havayolu ulaşımına olan talebin artmasının yanı sıra, teknolojik imkanların da artması bu alanda oluşan verilerin daha kolay depolanmasına ve oluşan bu büyük veri ile faydalı analizler yapılmasına imkan tanımaktadır. Bu analizlerin yapılabilmesi için kullanılan makine öğrenmesi yöntemleri son yıllarda önemli bir ivme kazanmıştır. Bu çalışmada, uçak gecikmelerinin sebep olduğu problemleri azaltabilmek adına makine öğrenmesi yöntemleri ile detaylı uçuş ve hava durumu verileri birlikte değerlendirilerek uçak gecikmelerinin tahmin edilmesi amaçlanmıştır. Bu doğrultuda, sektörde faaliyet gösteren uluslararası bir havayolu şirketiyle irtibata geçilerek çalışmada kullanılacak olan uçuş verileri temin edilmiştir. Uçuş bilgileri kapsamında uçakların planlanan kalkış ve varış zamanları, uçakların piste çıkış/varış zamanları, hangi havalimanları arasında seyahat gerçekleştirdiği, seyahatlerin tam tarih bilgileri gibi konularda üç yıllık (2016-2017-2018) veriler toplanmıştır. Bu veriye ek olarak hava durumuna ilişkin veriler ise çevrimiçi kaynaklardan elde edilmiştir. Hava durumu için ise, kalkış ve varış havalimanlarının planlanan kalkış/varış saatlerindeki hava durumu verileri (sıcaklık, basınç, bulutluluk durumu, görüş mesafesi, olağanüstü hava durumları vb.) dikkate alınmıştır. Havayolu firmasının üç yıllık uçuş verileri ile uçak kalkış ve varış zamanındaki hava durumu eşleştirilerek uçuşların durumunu tahmin etmek üzere veri seti oluşturulmuştur. Oluşturulan veri seti, makine öğrenme yöntemleri içerisinde yer alan Yapay Sinir Ağları, Rastgele Ormanlar, XGBoost, LightGBM ve CatBoost ile incelenmiş ve analiz edilmiştir. Bu modellerin performansı ise hata matrisi temelli çeşitli birçok performans metriklerine göre değerlendirilmiş ve elde edilen bulgular birbirleri ile karşılaştırılarak yorumlanmıştır. The demand for air transportation has risen as the world's mobility has increased. In addition to the demand for passenger transport, the share of airline transportation, particularly for light and valuable goods, is growing day by day. Increasing demand for both passenger and cargo over the years lead to flight delays, and which has a negative impact on many stakeholders. The fact that the delays cannot be predicted until the last moment conduce to many problems such as congestion at airports, long waiting periods for some passengers or missing connected flights.In addition to the increase in demand for airline transportation, technological developments are enabled to store data easily and using this big data it has become possible to make useful analyzes. Machine learning methods have gained significant momentum in recent years in terms of making these analyzes.In this study, it is aimed to predict aircraft delays by machine learning methods with using detailed flight and weather data together in order to reduce the problems caused by the delays. Accordingly, an international airline company which is operating in the aviation sector is contacted and flight data to be used in the study is obtained through them. Within the scope of flight information, three-year (2016-2017-2018) data are collected such as the planned departure and arrival times of the planes, the departure arrival times of the planes, the airports they travel between, and the exact date information of the trips. In addition to this data, weather data were obtained from online sources. For this, the weather data (temperature, pressure, cloudiness, visibility, extraordinary weather conditions, etc.) at the planned departure /arrival times of the departure and arrival airports are taken into consideration. A data set was created to estimate the status of the flights by matching the airline company's three-year flight data with the weather at the time of aircraft departure and arrival. The created data set was examined and analyzed with Artificial Neural Networks, Random Forests, Extreme Boosting, Light Gradient Boosting and Categorical Boosting, which are among machine learning methods. The performance of these models is evaluated according to various performance metrics based on error matrix and the findings obtained are compared with each other and interpreted.
Collections