Please use this identifier to cite or link to this item:
https://hdl.handle.net/20.500.11779/1204
Title: | Mortality Prediction of Countries | Other Titles: | Ülkelerin ölüm tahminlemesi | Authors: | Üşenmez, Elif Efser | Advisors: | Koç, Utku | Keywords: | Exploratory Data Analysis Statistical Regression Model Machine Learning Regression Algorithms Mortality Prediction Keşif Veri Analizi İstatistiksel Regresyon Modelleri Makine Öğrenmesi Regresyon Algoritmaları Ölüm Tahminleme |
Publisher: | MEF Üniversitesi, Fen Bilimleri Enstitüsü | Source: | Üşenmez, EE. (2018). Mortality prediction of countries, MEF Üniversitesi Fen Bilimleri Enstitüsü, İstanbul, Türkiye | Abstract: | In this study mortality reasons of countries detailed by sex and age-group is analyzed and different forecasting models are developed by using different machine learning algorithms. The dataset is obtained from the World Health Organization(WHO) Mortality Database. In WHO database there are different datasets for countries mortality reason number. The study used the dataset that used ICD-10 for classifying mortality reasons.ICD-10 is the 10 revision of International Statistical Classification of Diseases and Related Health Problems published by the World Health Organization. In addition to main mortality reason datasets, we add different independent variables and try to find the best features to fit models without biasing and overfitting and reaching high R2 and Mean Square Errors. To find the best model for forecasting mortality reasons by age-groups and sex different machine learning algorithms are fitted and results of these algorithms are analyzed. Bu çalışmanın amacı ülkelerin cinsiyet ve yaş bazlı ölüm nedenlerini analiz ederek farklı makine öğrenmesi algoritmaları ile modeller oluşturarak en iyi modeli bulmaktır. Çalışmada kullanılan veri seti Dünya Sağlık Örgütünün Ölüm nedeni veri ambarından elde edilmiştir. İlgili veri ambarında ülkelerin ölüm nedeni rakamları ile ilgili birden fazla veri seti vardır. Bu çalışmada ölüm nedenleri ICD-10’a göre sınıflandırılan veri seti kullanılmıştır. ICD-10 Dünya Sağlık Örgütü tarafından yayımlanan hastalıkların ve ilgili sağlık sorunlarının uluslararası istatistiksel sınıflandırılması için kullanılan ICD(International Classification of Diseases) serisinin 10 uncu sürümüdür Ana ölüm nedeni verisine ek olarak farklı bağımsız değişkenler ekleyerek modeller en iyi değişkenler bulunmaya çalışılmıştır. Modeller için en iyi değişkenler seçilirken modellerde yanlılık ve ve aşırı öğrenmeye yol açmamasına ve modellerde en uygun R2 ve ortalama karesel hatalara ulaşılmasına bakılmıştır. Farklı tahminleme modellerinin sonuçları incelenerek cinsiyet, yaş grubu ve neden bazında ölüm tahminlemesi için en uygun model bulunmaya çalışılmıştır. |
URI: | https://hdl.handle.net/20.500.11779/1204 |
Appears in Collections: | FBE, Yüksek Lisans, Proje Koleksiyonu |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
ElifEfserÜşenmez.pdf | YL-Proje Dosyası | 1.65 MB | Adobe PDF | View/Open |
CORE Recommender
Page view(s)
86
checked on Jan 20, 2025
Download(s)
12
checked on Jan 20, 2025
Google ScholarTM
Check
Items in GCRIS Repository are protected by copyright, with all rights reserved, unless otherwise indicated.