Objective: Hierarchical data with two or more levels are common in different fields of research including medical, educational, social and sports sciences. Maximum likelihood (ML) and Bayesian Markov Chain Monte Carlo (MCMC) estimation methods are widely used in regression analyses used for modelling these hierarchical data. However, the performances of these methods are not well studied for the estimation of three-level models. This paper aims at finding the optimal estimation technique under various combinations of number of clusters at second and third levels in three-level data sets. Material and Methods: A data application example is presented using a three-level dataset on football player's performance. Then, a simulation study based on the 3-level hierarchical linear model is performed for the comparison of four different maximum likelihood and Bayesian estimation approaches under various number clusters. Results: The data analysis and simulation study illustrate how strongly different estimation approaches affect the model parameter estimates, especially variance components. It is found that, if the main interest of the analysis is in the fixed part of the model, then any maximum likelihood or Bayesian method can be used, provided that the number of clusters at both levels are more than four. However, the main difference between these meth-ods occurred in estimating the random terms. Conclusion: Results of the simulation study showed that using restricted maximum likelihood method is associated with better results for both regression coefficient and variance estimates. Obtaining valid variance estimates with Bayesian MCMC estimation requires careful consideration for defining prior distributions.
Keywords: Bayesian hierarchical modelling; mixed effects model; multilevel modelling; three-level clustering
Amaç: Tıp, eğitim, sosyal ve spor bilimleri dahil olmak üzere farklı araştırma alanlarında iki veya daha fazla düzeyli hiye-rarşik veriler yaygındır. Bu hiyerarşik verileri modellemek için kullanılan regresyon analizlerinde maksimum olabilirlik ve Bayesçi Markov Zinciri Monte Carlo (MZMC) tahmin yöntemleri yaygın olarak kullanılmaktadır. Ancak, bu yöntemlerin performansı üç düzeyli modellerin tahmini için yeterince çalışılmamıştır. Bu makale, üç düzeyli veri setlerinde ikinci ve üçüncü düzeylerindeki çeşitli küme sayısı kombinasyonları altında en iyi tahmin tekniğini bulmayı amaçlamaktadır. Gereç ve Yöntemler: Futbolcu performanslarına dair üç düzeyli bir veri seti kullanılarak bir veri uygulama örneği sunulmuştur. Sonrasında, dört farklı maksimum olabilirlik ve Bayesçi tahmin yaklaşımlarını farklı küme sayıları altında karşılaştırmak için, üç düzeyli hiyerarşik doğrusal modele dayanan bir simülasyon çalışması yapılmıştır. Bulgular: Veri analizi ve simülasyon çalışması, farklı tahmin yaklaşımlarının model parametre tahminlerini, özellikle varyans bileşenlerini ne kadar güçlü etkilediğini göstermiştir. Eğer analizin temel ilgi konusu modelin sabit kısmıysa, her iki düzeydeki küme sayısının dörtten fazla olması koşuluyla herhangi bir maksimum olabilirlik ve Bayesçi yöntemin kullanılabileceği sonucuna varılmıştır. Ancak, bu yöntemler arasındaki temel fark, rastgele terimleri tahmin etmede ortaya çıkmıştır. Sonuç: Simülasyon çalışmasının sonuçları, sınırlı maksimum olabilirlik yön-teminin kullanılmasının hem regresyon katsayısı hem de varyans tahminleri için daha iyi sonuçlarla ilişkili olduğunu göstermiştir. Bayesçi MZMC tahmini ile geçerli varyans tahminleri elde etmek, önsel dağılımları tanımlamak için dikkatli bir değerlendirme gerektirmektedir.
Anahtar Kelimeler: Bayesçi hiyerarşik modelleme; karma etkili modeller; çok düzeyli modelleme; üç-düzeyli kümeleme
- Olvera Astivia OL, Gadermann A, Guhn M. The relationship between statistical power and predictor distribution in multilevel logistic regression: a simulation-based approach. BMC Med Res Methodol. 2019;19(1):97.[Crossref] [PubMed] [PMC]
- Gelman A. Multilevel (hierarchical) modeling: what it can and cannot do. Technometrics. 2019;48(3):432-5.[Crossref]
- McNeish D, Wentzel KR. Accommodating small sample sizes in three-level models when the third level is incidental. Multivariate Behav Res. 2017;52(2):200-15.[Crossref] [PubMed]
- Boedeker P. Hierarchical linear modeling with maximum likelihood, restricted maximum likelihood, and fully Bayesian estimation. Practical Assessment, Research and Evaluation. 2017;22.[Crossref]
- Browne WJ, Draper D. A comparison of Bayesian and likelihood-based methods for fitting multilevel models. Bayesian Analysis. 2006;1(3):473-514.[Crossref]
- Gumedze FN, Dunne TT. Parameter estimation and inference in the linear mixed model. Linear Algebra and its Applications. 2011;435(8):1920-44.[Crossref]
- Goldstein H. Multilevel Statistical Models. London: Institute of Education; 1999.
- Hox JJ, Moerbeek M, Van de Schoot R. Multilevel Analysis: Techniques and Applications. Routledge; 2017.[Crossref] [PMC]
- Corbeil RR, Searle SR. Restricted maximum likelihood (REML) estimation of variance components in the mixed model. Technometrics. 1976;18(1):31-8.[Crossref]
- McCulloch CE, Neuhaus JM. Generalized linear mixed models. Wiley StatsRef: Statistics Reference Online, 2014.[Crossref]
- Jiang J, Rao J, Gu Z, Nguyen T. Fence methods for mixed model selection. The Annals of Statistics. 2008;36(4):1669-92.[Crossref]
- Verbyla AP. Modelling variance heterogeneity: residual maximum likelihood and diagnostics. Journal of the Royal Statistical Society: Series B (Methodological). 1993;55(2):493-508.[Crossref]
- Browne WJ. MCMC Estimation in MLwiN v3.03. Centre for Multilevel Modelling, University of Bristol; 2019.
- Jones A, Huddleston E. SAS/STAT 9.2 User's Guide. 2nd ed. Cary, NC: SAS Institute; 2009.[Link]
- Townsend J, Busemeyer J, Kruschke J, Vanpaemel W. Bayesian Estimation in Hierarchical Models. In: Busemeyer JR, Wang Z, Townsend JT, Eidels A, eds. The Oxford Handbook of Computational and Mathematical Psychology. New York, NY: Oxford University Press; 2015.
- Daniels MJ. A prior for the variance in hierarchical models. The Canadian Journal of Statistics. 1999;27:567-78.[Crossref]
- Gelman A, Shalizi CR. Philosophy and the practice of Bayesian statistics. Br J Math Stat Psychol. 2013;66(1):8-38.[Crossref] [PubMed] [PMC]
- McNeish D, Stapleton L. The effect of small sample size on two-level model estimates: a review and illustration. Educational Psychology Review. 2016;28(2):295-314.[Crossref]
.: Process List