Please use this identifier to cite or link to this item: https://hdl.handle.net/20.500.11779/1204
Title: Mortality prediction of countries
Other Titles: Ülkelerin ölüm tahminlemesi
Authors: Üşenmez, Elif Efser
Advisors: Koç, Utku
Keywords: Exploratory Data Analysis
Statistical Regression Model
Machine Learning Regression Algorithms
Mortality Prediction
Keşif Veri Analizi
İstatistiksel Regresyon Modelleri
Makine Öğrenmesi Regresyon Algoritmaları
Ölüm Tahminleme
Publisher: MEF Üniversitesi, Fen Bilimleri Enstitüsü
Source: Üşenmez, EE. (2018). Mortality prediction of countries, MEF Üniversitesi Fen Bilimleri Enstitüsü, İstanbul, Türkiye
Abstract: In this study mortality reasons of countries detailed by sex and age-group is analyzed and different forecasting models are developed by using different machine learning algorithms. The dataset is obtained from the World Health Organization(WHO) Mortality Database. In WHO database there are different datasets for countries mortality reason number. The study used the dataset that used ICD-10 for classifying mortality reasons.ICD-10 is the 10 revision of International Statistical Classification of Diseases and Related Health Problems published by the World Health Organization. In addition to main mortality reason datasets, we add different independent variables and try to find the best features to fit models without biasing and overfitting and reaching high R2 and Mean Square Errors. To find the best model for forecasting mortality reasons by age-groups and sex different machine learning algorithms are fitted and results of these algorithms are analyzed.
Bu çalışmanın amacı ülkelerin cinsiyet ve yaş bazlı ölüm nedenlerini analiz ederek farklı makine öğrenmesi algoritmaları ile modeller oluşturarak en iyi modeli bulmaktır. Çalışmada kullanılan veri seti Dünya Sağlık Örgütünün Ölüm nedeni veri ambarından elde edilmiştir. İlgili veri ambarında ülkelerin ölüm nedeni rakamları ile ilgili birden fazla veri seti vardır. Bu çalışmada ölüm nedenleri ICD-10’a göre sınıflandırılan veri seti kullanılmıştır. ICD-10 Dünya Sağlık Örgütü tarafından yayımlanan hastalıkların ve ilgili sağlık sorunlarının uluslararası istatistiksel sınıflandırılması için kullanılan ICD(International Classification of Diseases) serisinin 10 uncu sürümüdür Ana ölüm nedeni verisine ek olarak farklı bağımsız değişkenler ekleyerek modeller en iyi değişkenler bulunmaya çalışılmıştır. Modeller için en iyi değişkenler seçilirken modellerde yanlılık ve ve aşırı öğrenmeye yol açmamasına ve modellerde en uygun R2 ve ortalama karesel hatalara ulaşılmasına bakılmıştır. Farklı tahminleme modellerinin sonuçları incelenerek cinsiyet, yaş grubu ve neden bazında ölüm tahminlemesi için en uygun model bulunmaya çalışılmıştır.
URI: https://hdl.handle.net/20.500.11779/1204
Appears in Collections:FBE, Yüksek Lisans, Proje Koleksiyonu

Files in This Item:
File Description SizeFormat 
ElifEfserÜşenmez.pdfYL-Proje Dosyası1.65 MBAdobe PDFThumbnail
View/Open
Show full item record



CORE Recommender

Google ScholarTM

Check





Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.