Research Article
BibTex RIS Cite

SAYMA VERİLERİNİN MODELLENMESİ VE BİREYLERİN İŞSİZ KALMA SÜRESİ ÜZERİNE BİR UYGULAMA

Year 2022, Issue: 50, 1 - 18, 20.04.2022
https://doi.org/10.30794/pausbed.1055797

Abstract

Bağımlı değişkenin sayıma dayalı veri olması durumunda güvenilir tahminler yapabilmek için Sayma Verisi Regresyon Modellerinin kullanılması daha uygundur. Sayıma dayalı veriler kesikli bir yapıda olduğundan bu regresyon modelleri kesikli dağılımlardan yararlanılarak geliştirilmiştir. Bu çalışmada, Türkiye İstatistik Kurumu (TÜİK) 2019 yılı Gelir ve Yaşam Koşulları Araştırması (GKYA) verilerinden yararlanarak bir sayma verisi olan bireylerin işsiz kaldığı sürenin (ay cinsinden) modellenmesi amaçlanmıştır. Analizde kullanılacak bağımsız değişkenler, tüm olası alt küme yöntemi ile medeni durum, eğitim durumu, genel sağlık ve kronik hastalık olarak belirlenmiştir. Sayma veri regresyon modellerinden Poisson Regresyon (PR), Negatif Binom Regresyon (NBR), Sıfır Değer Ağırlıklı Negatif Binom Regresyon (ZINB) ve Genelleştirilmiş Poisson Regresyon (GPR) modelleri ele alınarak, bu dört model tahmin edilmiş ve veri setine en iyi uyum sağlayan model bilgi kriterleri ile belirlenmiştir. Tahmin edilen modeller içerisinde veri setine en iyi uyum sağlayan modelin ZINB modeli olduğu belirlenmiştir.

References

  • Agresti, A. (2015). Foundations of Linear and Generalized Linear Models. John Wiley & Sons Inc., Hoboken, New Jersey.
  • Avcı, E. (2018). “Using Count Regression Models to Determine the Factors which Effects the Hospitalization Number of People with Schizophrenia”, Journal of Data Science, 16(3), 511-528.
  • Beaujean, A. A. ve Grant, M. B. (2016). “Tutorial on Using Regression Models with Count Outcomes Using R. Practical Assessment, Research.” and Evaluation, 21(2).
  • Bekalo, D. B. ve Kebede, D. T. (2021). “Zero-Inflated Models Count Data: An Application to Number of Antenatal Care Service Visits.” Annals of Data Science, 8(4), 683-708.
  • Briz- Redón, Á., Mateu, J. ve Montes, F. (2021). “Modeling Accident Risk at the Road Level Through Zero-Inflated Negative Binomial Models: A Case Study of Multiple Road Networks.” Spatial Statistics, 43, 1-13.
  • Cameron, A. C. ve Trivedi, P. K. (1998). Regression Analysis of Count Data. New York: Cambridge University Press.
  • Dinarcan, G. N. (2018). Sayma Verisi İçin Regresyon Modelleri Ve Bir Uygulama. Yüksek Lisans Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü, Ankara.
  • Ercan, U. (2021). “Hanehalklarının İletişim ve Bilgi Teknolojilerine Erişimi: Bir Poisson Regresyon Analizi.” Akdeniz Üniversitesi İletişim Fakültesi Dergisi, 35, 402-422.
  • Famoye, F. ve Singh, K. D. (2006). “Zero-Inflated Generalized Poisson Regression Model with an Application to Domestic Violence Data.” Journal of Data Science, 4(1), 117-130.
  • Gujarati, D. N ve Porter, D. C. (2012). (Çev. Şenesen, Ü., ve Günlük-Şenesen, G.) Temel ekonometri. Literatür Yayıncılık.
  • Hilbe, J.M. (2014). Modeling Count Data. Cambridge University Press.
  • Ismail, N. ve Zamani, H. (2013). “Estimation of Claim Count Data using Negative Binomial, Generalized Poisson, Zero-Inflated Negative Binomial and Zero-Inflated Generalized Poisson Regression Models.” Casualty Actuarial Society E-Forum.
  • Kaya, Y. ve Yeşilova, A. (2012). “E-Posta Trafiğinin Sıfır Değer Ağırlıklı Regresyon Yöntemleri Kullanılarak İncelenmesi.” Anadolu Üniversitesi Bilim ve Teknoloji Dergisi-A Uygulamalı Bilimler ve Mühendislik,13(1),51-63.
  • Kılıç, D. ve Bayrak, H. (2020). “Sayma Verisi Modelleri Üzerine Bir Karşılaştırma: E-Ticarette Yaşanan Sorunlar Türkiye Örneği.” Selçuk Üniversitesi Fen Fakültesi Fen Dergisi, 46(2), 85-102.
  • Kıran, G. (2019). Sayma Veri Modelleri ve Bir Uygulama. Yüksek Lisans Tezi, Marmara Üniversitesi Sosyal Bilimler Enstitüsü, İstanbul.
  • Lawless, J. F. (1987). “Negative Binomial and Mixed Poisson Regression.” The Canadian Journal of Statistics, 15(3), 209-225.
  • McCullagh, P. ve Nelder, J. A. (1989). Generalized Linear Models. (Second Edition). London: Chapman and Hall.
  • Mert, M. (2016). Yatay Kesit Veri Analizi Bilgisayar Uygulamaları. Ankara: Detay Yayıncılık.
  • Nelder, J. A. ve Wedderburn, R. W. M. (1972). “Generalized Linear Models.” Journal of the Royal Statistical Society, Series A (Statistics in Society). 135 (5), 370-384.
  • Özmen, İ. ve Famoye, F. (2007). “Count Regression Models with an Application to Zoological Data Containing Structural Zeros.” Journal of Data Science,5(4), 491-502.
  • Peng, J., Lyu, T., Shi, J., Nagaraja, H. N. ve Xiang, H. (2014). “Models for Injury Count Data in the U.S. National Health Interview Survey.” Journal of Scientific Research & Reports,3(17), 2286-2302.
  • Selim, S. ve Kılınç, G. (2021). “Bebek Ölümlerini Etkileyen Faktörler Üzerine Sayma Veri Regresyon Modellerinin Karşılaştırmalı Analizi.” Ekoist: Journal of Econometrics and Statistics, 35, 147-179.
  • Singh, K. P. ve Famoye, F. (1993). “Analysis of Rates Using a Generalized Poisson Regression Model. Biometrical Journal.” 35(8), 917-923.
  • Tarı, R. (2018). Ekonometri. (13. Baskı). Kocaeli: Umuttepe Yayınları
  • Tüzel, S. ve Sucu, M. (2012). “Hasar Sıklıkları İçin Sıfır Yığılmalı Kesikli Modeller.” İstatistikçiler Dergisi, 5(1), 23-31.
  • Wang, W. ve Famoye, F. (1997). “Modeling Household Fertility Decisions with Generalized Poisson Regression.” Journal of Population Economics, 10(3), 273-283.
  • Zulkifli, M., Ismail, N. ve Razali, A. M. (2012). “Zero-Inflated Regression Models With an Application to Vehicle Theft Count Data.” Technology, Science, Social Science and Humanities International Conference.

COUNT DATA MODELING AND AN APPLICATION ON UNEMPLOYMENT DURATION OF INDIVIDUALS

Year 2022, Issue: 50, 1 - 18, 20.04.2022
https://doi.org/10.30794/pausbed.1055797

Abstract

In cases where the dependent variable is count data, it is more appropriate to use Count Data Regression Models in order to produce reliable estimates. These regression models have been developed using discrete distributions since the count data has a discrete structure. The study, it is aimed to model the unemployment duration (in months) of individuals which is count data by using the data of the Survey of Income and Living Conditions (SILC) of the Turkish Statistical Institute (TURKSTAT) in 2019. The independent variables to be used in the analysis are marital status, educational status, general health, and chronic disease have been determined by all possible subset method. The Poisson Regression (PR), Negative Binomial Regression (NBR), Zero Inflated Negative Binomial Regression (ZINB), and Generalized Poisson Regression (GPR) models from count data regression models have been estimated and it has been determined the model best fits data by the information criteria. It has been determined that the model that best fits the data set among the predicted models is the ZINB model.

References

  • Agresti, A. (2015). Foundations of Linear and Generalized Linear Models. John Wiley & Sons Inc., Hoboken, New Jersey.
  • Avcı, E. (2018). “Using Count Regression Models to Determine the Factors which Effects the Hospitalization Number of People with Schizophrenia”, Journal of Data Science, 16(3), 511-528.
  • Beaujean, A. A. ve Grant, M. B. (2016). “Tutorial on Using Regression Models with Count Outcomes Using R. Practical Assessment, Research.” and Evaluation, 21(2).
  • Bekalo, D. B. ve Kebede, D. T. (2021). “Zero-Inflated Models Count Data: An Application to Number of Antenatal Care Service Visits.” Annals of Data Science, 8(4), 683-708.
  • Briz- Redón, Á., Mateu, J. ve Montes, F. (2021). “Modeling Accident Risk at the Road Level Through Zero-Inflated Negative Binomial Models: A Case Study of Multiple Road Networks.” Spatial Statistics, 43, 1-13.
  • Cameron, A. C. ve Trivedi, P. K. (1998). Regression Analysis of Count Data. New York: Cambridge University Press.
  • Dinarcan, G. N. (2018). Sayma Verisi İçin Regresyon Modelleri Ve Bir Uygulama. Yüksek Lisans Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü, Ankara.
  • Ercan, U. (2021). “Hanehalklarının İletişim ve Bilgi Teknolojilerine Erişimi: Bir Poisson Regresyon Analizi.” Akdeniz Üniversitesi İletişim Fakültesi Dergisi, 35, 402-422.
  • Famoye, F. ve Singh, K. D. (2006). “Zero-Inflated Generalized Poisson Regression Model with an Application to Domestic Violence Data.” Journal of Data Science, 4(1), 117-130.
  • Gujarati, D. N ve Porter, D. C. (2012). (Çev. Şenesen, Ü., ve Günlük-Şenesen, G.) Temel ekonometri. Literatür Yayıncılık.
  • Hilbe, J.M. (2014). Modeling Count Data. Cambridge University Press.
  • Ismail, N. ve Zamani, H. (2013). “Estimation of Claim Count Data using Negative Binomial, Generalized Poisson, Zero-Inflated Negative Binomial and Zero-Inflated Generalized Poisson Regression Models.” Casualty Actuarial Society E-Forum.
  • Kaya, Y. ve Yeşilova, A. (2012). “E-Posta Trafiğinin Sıfır Değer Ağırlıklı Regresyon Yöntemleri Kullanılarak İncelenmesi.” Anadolu Üniversitesi Bilim ve Teknoloji Dergisi-A Uygulamalı Bilimler ve Mühendislik,13(1),51-63.
  • Kılıç, D. ve Bayrak, H. (2020). “Sayma Verisi Modelleri Üzerine Bir Karşılaştırma: E-Ticarette Yaşanan Sorunlar Türkiye Örneği.” Selçuk Üniversitesi Fen Fakültesi Fen Dergisi, 46(2), 85-102.
  • Kıran, G. (2019). Sayma Veri Modelleri ve Bir Uygulama. Yüksek Lisans Tezi, Marmara Üniversitesi Sosyal Bilimler Enstitüsü, İstanbul.
  • Lawless, J. F. (1987). “Negative Binomial and Mixed Poisson Regression.” The Canadian Journal of Statistics, 15(3), 209-225.
  • McCullagh, P. ve Nelder, J. A. (1989). Generalized Linear Models. (Second Edition). London: Chapman and Hall.
  • Mert, M. (2016). Yatay Kesit Veri Analizi Bilgisayar Uygulamaları. Ankara: Detay Yayıncılık.
  • Nelder, J. A. ve Wedderburn, R. W. M. (1972). “Generalized Linear Models.” Journal of the Royal Statistical Society, Series A (Statistics in Society). 135 (5), 370-384.
  • Özmen, İ. ve Famoye, F. (2007). “Count Regression Models with an Application to Zoological Data Containing Structural Zeros.” Journal of Data Science,5(4), 491-502.
  • Peng, J., Lyu, T., Shi, J., Nagaraja, H. N. ve Xiang, H. (2014). “Models for Injury Count Data in the U.S. National Health Interview Survey.” Journal of Scientific Research & Reports,3(17), 2286-2302.
  • Selim, S. ve Kılınç, G. (2021). “Bebek Ölümlerini Etkileyen Faktörler Üzerine Sayma Veri Regresyon Modellerinin Karşılaştırmalı Analizi.” Ekoist: Journal of Econometrics and Statistics, 35, 147-179.
  • Singh, K. P. ve Famoye, F. (1993). “Analysis of Rates Using a Generalized Poisson Regression Model. Biometrical Journal.” 35(8), 917-923.
  • Tarı, R. (2018). Ekonometri. (13. Baskı). Kocaeli: Umuttepe Yayınları
  • Tüzel, S. ve Sucu, M. (2012). “Hasar Sıklıkları İçin Sıfır Yığılmalı Kesikli Modeller.” İstatistikçiler Dergisi, 5(1), 23-31.
  • Wang, W. ve Famoye, F. (1997). “Modeling Household Fertility Decisions with Generalized Poisson Regression.” Journal of Population Economics, 10(3), 273-283.
  • Zulkifli, M., Ismail, N. ve Razali, A. M. (2012). “Zero-Inflated Regression Models With an Application to Vehicle Theft Count Data.” Technology, Science, Social Science and Humanities International Conference.
There are 27 citations in total.

Details

Primary Language Turkish
Subjects Finance
Journal Section Articles
Authors

Afet Sözen Özden 0000-0001-9821-7029

Elvan Hayat 0000-0001-8200-8046

Early Pub Date May 15, 2022
Publication Date April 20, 2022
Acceptance Date January 25, 2022
Published in Issue Year 2022 Issue: 50

Cite

APA Sözen Özden, A., & Hayat, E. (2022). SAYMA VERİLERİNİN MODELLENMESİ VE BİREYLERİN İŞSİZ KALMA SÜRESİ ÜZERİNE BİR UYGULAMA. Pamukkale Üniversitesi Sosyal Bilimler Enstitüsü Dergisi(50), 1-18. https://doi.org/10.30794/pausbed.1055797
AMA Sözen Özden A, Hayat E. SAYMA VERİLERİNİN MODELLENMESİ VE BİREYLERİN İŞSİZ KALMA SÜRESİ ÜZERİNE BİR UYGULAMA. PAUSBED. April 2022;(50):1-18. doi:10.30794/pausbed.1055797
Chicago Sözen Özden, Afet, and Elvan Hayat. “SAYMA VERİLERİNİN MODELLENMESİ VE BİREYLERİN İŞSİZ KALMA SÜRESİ ÜZERİNE BİR UYGULAMA”. Pamukkale Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, no. 50 (April 2022): 1-18. https://doi.org/10.30794/pausbed.1055797.
EndNote Sözen Özden A, Hayat E (April 1, 2022) SAYMA VERİLERİNİN MODELLENMESİ VE BİREYLERİN İŞSİZ KALMA SÜRESİ ÜZERİNE BİR UYGULAMA. Pamukkale Üniversitesi Sosyal Bilimler Enstitüsü Dergisi 50 1–18.
IEEE A. Sözen Özden and E. Hayat, “SAYMA VERİLERİNİN MODELLENMESİ VE BİREYLERİN İŞSİZ KALMA SÜRESİ ÜZERİNE BİR UYGULAMA”, PAUSBED, no. 50, pp. 1–18, April 2022, doi: 10.30794/pausbed.1055797.
ISNAD Sözen Özden, Afet - Hayat, Elvan. “SAYMA VERİLERİNİN MODELLENMESİ VE BİREYLERİN İŞSİZ KALMA SÜRESİ ÜZERİNE BİR UYGULAMA”. Pamukkale Üniversitesi Sosyal Bilimler Enstitüsü Dergisi 50 (April 2022), 1-18. https://doi.org/10.30794/pausbed.1055797.
JAMA Sözen Özden A, Hayat E. SAYMA VERİLERİNİN MODELLENMESİ VE BİREYLERİN İŞSİZ KALMA SÜRESİ ÜZERİNE BİR UYGULAMA. PAUSBED. 2022;:1–18.
MLA Sözen Özden, Afet and Elvan Hayat. “SAYMA VERİLERİNİN MODELLENMESİ VE BİREYLERİN İŞSİZ KALMA SÜRESİ ÜZERİNE BİR UYGULAMA”. Pamukkale Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, no. 50, 2022, pp. 1-18, doi:10.30794/pausbed.1055797.
Vancouver Sözen Özden A, Hayat E. SAYMA VERİLERİNİN MODELLENMESİ VE BİREYLERİN İŞSİZ KALMA SÜRESİ ÜZERİNE BİR UYGULAMA. PAUSBED. 2022(50):1-18.