Amaç: Bağımlı değişkenin sayma/kesikli olma durumuyla birçok araştırmada karşılaşılmaktadır. Her ne kadar Poisson regresyon modeli sayma verilerinin analizinde sıklıkla kullanılsa da ortalama ile varyans eşitliği varsayımı birçok deneysel veri için sağlanmamaktadır. Aşırı/az yayılım olarak tanımlanan bu durumlarda alternatif regresyon modelleriyle analiz edilmesi daha uygun olmaktadır. Hem aşırı hem de az yayılım durumu için uygun analiz olanağı veren Conway-Maxwell-Poisson Regresyon modeli ayrıntılı olarak tanıtmaktır. Gereç ve Yöntemler: Poisson, negatif binom ve COM-Poisson regresyon modelleri önce aşırı yayılım gösteren 2011-2014 yılları arasında Giresun ili Toplum Ruh Sağlığı Merkezine (TRSM) kayıtlı olan hastaların, merkeze gelme sayılarına etki eden sosyo-demografik faktörlerin modellenmesinde, daha sonra az yayılım gösteren öğretmenlerin sosyal medya hesap sayılarına etki eden okul türü, cinsiyet ve yaş grubu faktörlerinin modellenmesinde uygulanmıştır. Her iki veri seti için değişken seçim yöntemi olarak tüm olası alt kümeler yöntemi kullanılmıştır. En küçük AIC değerli model en iyi model olarak seçilmiştir. Bulgular: TRSM'ye geliş sayılarına cinsiyet, eğitim düzeyi, medeni durum ile sosyal güvence durumunun, sosyal medya hesabına ise okul türü ve yaş grubunun etkili olduğu saptanmıştır. Sonuç: Her iki veri setinde de COM-Poisson regresyon en iyi modeli oluşturmuştur.
Anahtar Kelimeler: Aşırı-az yayılım; Conway-Maxwell-Poisson; sayma veri; negatif binom regresyon; Poisson regresyon
Objective: Counting/discrete dependent variable is encountered in many studies. Although the Poisson regression model is frequently used in the analysis of counting data, the assumption of the equality of mean and variance is not provided for many experimental data. It is more appropriate to analyze with alternative regression models in case of over-under dispersion. The Conway-Maxwell-Poisson Regression model which is suitable for analysis of both over-under dispersed data is presenting in detail. Material and Methods: Poisson, negative binomial and COM-Poisson regression models were used to determine the effect of socio-demographic factors on the number of visits Giresun Community Mental Health Center (TRSM) between 2011 and 2014. Then, three regression models applied to model school type, gender, and age group factors with the number of social media accounts of the teachers. All possible subset regression approach was used as a variable selection method for both data sets. The smallest AIC-valued model was selected as the best model. Results: It was determined that gender, education level, marital status and social security status were effective on the number of arrivals to TRSM and the type of school and age group on social media account. Conclusion: COM-Poisson regression was the best model in both datasets.
Keywords: Over-under dispersion; Conway-Maxwell-Poisson; count data; negative binomial regression; Poisson regression.
- Lewis SL, Montgomery DC, Myers RH. Examples of designed experiments with nonnormal responses. J Qual Technol. 2001;33(3):265-78. [Crossref]
- Mccullagh P, Nelder JA. Background an outline of generalized linear models. Generalized Linear Models. 2nd ed. London: Chapman & Hall; 1989. p.30-5. [Crossref] [PMC]
- Nelder AJ, Wedderburn RWM. Generalized linear models. J R Statis Soc A. 1972;135(3):370-84. [Crossref]
- Conway RW, Maxweal WL. A queuing model with state dependent service rates. Journal of Industrial Engineering. 1962;12:132-6.
- Shmueli G, Minka TP, Kadane JB, Borle S, Boatwright P. A useful distribution for fitting discrete data: revival of the conway-maxwell-poisson distribution. Appl Statist. 2005;54(1):127-42. [Crossref]
- Sellers KF, Borle S, Shmueli G. The COM-poisson model for count data: a survey of methods and applications. Appl Stoch Models Bus Ind. 2012;28:104-16. [Crossref]
- Santarelli MF, Della Latta D, Scipioni M, Positano V, Landini L. A conway-maxwell-poisson (CMP) model to addres data dispersion on positron emission tomography. Comput Biol Med. 2016;77:90-101. [Crossref] [PubMed]
- Zhu F. Modelling the series of counts with COM-poisson INGARCH models. Math Comput Model. 2012;56(9-10):191-203. [Crossref]
- Avcı E. Using count regression models to determine the factory which effects the hospitalization number of people with schizophrenia. Journal of Data Science. 2018;16(3):511-30.
- Avcı E. Flexiblity of using COM-poisson regression model for count data. Statistics Optimization and Information Computing. 2018;6:278-85. [Crossref]
- Poisson SD. Recherches. Probabilité des Jugements en Matière Criminelle et en Matière Civile, Précédées des Règles Générales du Calcul des Probabilitiés. 1st ed. Paris, France: Bachelier; 1837. p.206.
- Deniz Ö. [Poisson regression analysis]. İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi. 2005;7:59-72.
- Sümbüloğlu K, Akdağ B. [Poisson regression analysis]. Hatipoğlu G, editör. İleri Biyoistatistiksel Yöntemler. 1. Baskı. Ankara: Hatiboğlu Yayınları; 2009. p.275-85.
- Saraçbaşı T, Aktaş Altunay S. Sayımla elde edilmiş veriler için regresyon modelleri. Kategorik Veri Çözümlemesi. 1. Baskı. Ankara: Hacettepe Üniversitesi Yayınları; 2016. p.159.
- Winner G, Altmann G. Thesaurus of Univariate Discrete Probability Distributions. 1st ed. Germany: STAMM, Essen; 1999. p.865.
- Khan NM, Khan MHM. Model for analyzing counts with over-,equi-and under-dispersion in actuarial statistics. J Math & Stat. 2010;6(2):92-5. [Crossref]
- Wedderburn RWM. Quasi-likelihood functions, generalized linear models and the Gauss-Newton method. Biometrika. 1974;61(3):439-47. [Crossref]
- Sellers KF, Shmueli G. A flexible regression model for count data. Ann Appl Stat. 2010;4(2):943-61. [Crossref]
- Sellers KF, Shmueli G. Data dispersion: Now you see it? Now you don't. Communication in Statistics: Theory and Methods. 2013;42(17):3134-47. [Crossref]
- Collett D. Strategy for model selection. Modelling Binary Data. 2nd ed. London: Chapman & Hall; 1991. p.240-4.
- Olsson M. Generalized Linear Models: An Applied Approach. Sweden: Student Literature; 2002. p.46-7.
.: Process List