Objective: The aim of this study is to compare the performance of the regression correlation coefficient (RCC) and its estimators, which is the measure of the power of the regression model, in terms of bias and root mean square error (RMSE), considering the multicollinearity for different sample sizes, regression intercept (α) parameters and missing observation rates. Material and Methods: Data were produced with MATLAB for the combination of different sample sizes (n: 50, 100, 200, 500), correlations between independent variables (r: 0.0, 0.70), α parameters (α: 0.0, 0.80) and missing observation ratios (m: 0%, 5%, 10%, 20%) for estimators of RCC. Then, randomly subtracted data were analyzed with Poisson regression model and this process was repeated 1,000 times. Results: Simulation results showed that leave-one-out-cross validation estimator ( crs) had the smallest bias and RMSE compared with the other estimators for n=50. All estimators provided similar bias and RMSE values depending on the increase in sample size. It was observed that was more robust than the others against to missing ratio for small sample size. In contrary to missing ratio, the most adversely affected estimator by multicollinearity was . Conclusion: The usage of Poisson regression model in clinical trials is wide spreading. Therefore, it is important to evaluate the success of the model in the best way. The study was the first study which investigated the effect of missing ratio on the estimators of RCC for Poisson regression model. It was detected that was the most successful estimator in the case of missing observations.
Keywords: Regression correlation coefficient; Poisson regression; missing ratio; re-sampling
Amaç: Bu çalışmanın amacı, Poisson regresyon modelinin gücünü gösteren regresyon korelasyon katsayısı (RKK) ve tahmin edicilerinin, farklı örnek genişlikleri, regresyon sabiti (α) parametreleri ve eksik gözlem oranları için çoklu bağlantı dikkate alınarak performanslarının yanlılık ve kök ortalama kare hatası [root mean square error (RMSE)] cinsinden karşılaştırılmasıdır. Gereç ve Yöntemler: Bu çalışmada, RKK'nın tahmin edicileri farklı örnek genişliği (n: 50, 100, 200, 500), bağımsız değişkenler arası korelasyon (r: 0,0, 0,70), α parametresi (α: 0,0, 0,80) ve eksik gözlem oranı (m: %0, %5, %10, %20) olmak üzere oluşturulan her bir kombinasyon için MATLAB programında üretilen ve tamamen rastgele olarak eksiltilen veriler Poisson regresyon modeli ile analiz edilmiş ve bu işlem 1.000 kere tekrarlanmıştır. Bulgular: Yapılan simülasyon sonuçlarına göre n=50 için çapraz geçerlilik tahmin edicisi ( diğer tahmin edicilere göre en düşük yanlılık ve RMSE değerine sahiptir. Örnek genişliği arttıkça tüm tahmin edicilerin yanlılık ve RMSE değerleri tüm kombinasyonlar için birbirine yaklaşmaktadır. Küçük örnek genişliğinde eksik gözleme en dayanıklı tahmin edici dir. Bu durumun aksine çoklu bağlantıdan en olumsuz etkilenen tahmin edici de dir. Sonuç: Poisson regresyon modelinin kullanımı klinik araştırmalarda gün geçtikçe artmaktadır. Model başarısını en doğru şekilde değerlendirmek de önemli hâle gelmektedir. Yapılan çalışma model performansını gösteren tahmin edicilerin başarısına eksik gözlemin etkisini Poisson regresyon modeli için inceleyen ilk çalışma olup, eksik gözlem durumunda en başarılı tahmin edicinin olduğu tespit edilmiştir.
Anahtar Kelimeler: Regresyon korelasyon katsayısı; Poisson regresyon; eksik gözlem; yeniden örnekleme
- Byers AL, Allore H, Gill TM, Peduzzi PN. Application of negative binomial modeling for discrete outcomes: a case study in aging research. J Clin Epidemiol. 2003;56(6):559-64. [Crossref] [PubMed]
- Kusuma RD, Purwono Y. Zero-Inflated Poisson Regression Analysis on Frequency of Health Insurance Claim PT. XYZ. Advances in Economics, Business and Management Research. 2018;72:321-5. [Crossref]
- Cameron AC, Windmeijer F. R-squared measures for count data regression models with applications to health care utilization. Journal of Business and Economic Statistics. 1996;14(2):209-20. [Crossref]
- Mittlbock M, Waldhor T. Adjustments for R2-measures for poisson regression model. Comput. Statist. Data Anal. 2000;34(4):461-72. [Crossref]
- Eshima N, Tabata M. Entropy correlation coefficient for measuring predictive power of generalized linear model. Statist. Probab. Let. 2007;77(6):588-93. [Crossref]
- Takahashi A, Kurosawa T. Regression correlation coefficient for a poisson regression model. Comput. Statist. Data Anal. 2016;98:71-8. [Crossref]
- Zheng B, Agresti A. Summarizing the predictive power of a generalized linear model. Stat Med. 2000;19(13):1771-81. [Crossref] [PubMed]
- Kaengthong N, Domthong U. Modified regression correlation coefficient for poisson regression model. Journal of Physics Conference Series. 2017;890(1):012155. [Crossref]
- Elhai JD, Calhoun PS, Ford JD. Statistical procedures for analyzing mental health services data. Psychiatry Res. 2008;160(2):129-36. [Crossref] [PubMed]
- Yu CH. Resampling methods: Concepts, applications and justification. Practical Assessment, Research and Evaluation. 2002;8(19):1-16. [Link]
- Turkan S, Ozel G. A new modified jackknifed estimator for the poisson regression model. Journal of Applied Statistics. 2015;43(10):1892-1905. [Crossref]
- Lukman AF, Adewuyi E, Mansson K, Kibria BMG. A new estimator for the multicollinear poisson regression model: Simulation and application. Scientific Reports. 2021;11:3732-43. [Crossref]
- Mansson K, Shukur G. A Poisson ridge regression estimator. Economic Modelling. 2011;28(4):1475-81. [Crossref]
- Orekici Temel G, Erdogan S, Ankaralı H. Sınıflama modelinin performansını değerlendirmede yeniden örnekleme yöntemlerinin kullanımı [Usage of resampling methods for evaluating the performance of classification model]. Bilişim Teknolojileri Dergisi. 2012;5(3):1-8.
.: Process List