Amaç: Bu çalışmanın amacı, 2x2 çapraz tablolarda kullanılan klasik ve süreklilik düzeltmeli ki-kare testlerini tanıtmak ve bunları karşılaştırmaktır. Gereç ve Yöntemler: Çalışmada serbestlik derecesi 1 (bir) olan ki-kare testleri dikkate alınmıştır. Çünkü bu testler, verilerin kesikli olmasından ciddi şekilde etkilenmektedir. Python-random kütüphanesi kullanılarak 10 ≤ n ≤25 aralığında yer alan 4 farklı n değeri için veri türetilmiştir. Verilerin türetilmesinde önce a,b,c ve d ile gösterilen gözelerden hangisine değer atanacağı sonra da ilgili gözeye atanacak değer belirlenmiştir. n=10 için 246, n=15 için 756, n=20 için 958, n=25 için 963 farklı veri seti çalışmada kullanılmıştır. Yöntemlerin karşılaştırılmasında hem her bir yöntemin hipotetik H0 hipotezini farklı örneklem büyüklüğü ve önemlilik düzeyleri için reddetme yüzdeleri hem de yöntemlerin birbirlerine göre hipotetik H0 hipotezini ret/ret, ret/kabul, kabul/ret ve kabul/kabul oranları kullanılmıştır. Bulgular: Çalışmada dikkate alınan yöntemlere ait sonuçlar, yöntemlerden birinin önerilen tüm yöntemler içerisinde en iyi yöntem olarak seçilmesini sağlamamaktadır. Farklı yöntemler farklı örneklem büyüklüklerinde ve önemlilik düzeylerinde öne çıkmaktadır. Bu durum, bir araştırmadan elde edilecek sonucunun doğru şekilde yorumlanamayacağı anlamına gelir. Tüm yöntemlerin örneklem büyüklüğü ve önemlilik düzeyinden etkilendiği, örneklem büyüklüğünün artması ve önemlilik düzeyinin de 0,01'den 0,10'a doğru değişmesi durumunda H0 hipotezinin reddedilme oranlarının da arttığı belirlenmiştir. Sonuç: Kikare testinin büyük örneklemler için uygun olduğu, beklenen değerlerden en az birinin 5'ten küçük olması durumunda gerek klasik gerekse süreklilik düzeltmeli ki-kare yöntemlerinin kullanılmaması gerektiği sonucuna ulaşılmıştır.
Anahtar Kelimeler: Hipotez testi; ki-kare testi; 2x2 çapraz tablo; süreklilik düzeltmesi
Objective: The aim of this study is to introduce and compare the classical and continuity corrected chi-square tests used in 2x2 contingency tables. Material and Methods: Chi-square tests with 1 (one) degree of freedom were taken into consideration in the study. Because these tests are seriously affected by the discontinuity of the data. Using the Python-random library, data was derived for 4 different values in the range of 10 ≤ n ≤25. In deriving the data, first the value to be assigned to the cells indicated by a, b, c and d was determined, and then the value to be assigned to the relevant cell was determined. 246 different data sets for n=10, 756 for n=15, 958 for n=20, and 963 for n=25 were used in the study. In the comparison of the methods, both the rejection percentages of each method for the hypothetical H0 hypothesis for different sample sizes and significance levels, and the rejection/rejection, rejection/acception, acception/rejection and acception/acception rates of the hypothetical H0 hypothesis of the methods relative to each other were used. Results: The results of the methods considered in the study do not enable one of the methods to be chosen as the best method among all the proposed methods. Different methods stand out at different sample sizes and significance levels. This means that the result of a study cannot be interpreted correctly. It has been determined that all methods are affected by the sample size and significance level, and if the sample size increases and the significance level changes from 0.01 to 0.10, the rejection rates of the H0 hypothesis also increase. Conclusion: It was concluded that the chi-square test is suitable for large samples, and if at least one of the expected values is less than 5, both the classical and continuity corrected chi-square methods should not be used.
Keywords: Hypothesis test; chi-square test; 2x2 contingency table; continuity correction
- McHugh ML. The chi-square test of independence. Biochem Med (Zagreb). 2013;23(2):143-9. [Crossref] [PubMed] [PMC]
- Zar HJ. Biostatistical Analysis. 3rd ed. New Jersey: Prentice Hall. Inc.; 1974.
- Fisher RA. Statistical Methods for Research Workers. 1st ed. Edinburgh: Oliver and Boyd; 1925.
- Cochran WG. Some methods of strengthening the common χ^2 tests. Biometrics. 1954;10(4):417-51. [Crossref]
- Lewontin RC, Felsenstein J. The robustness of homogeneity tests in 2xN tables. Biometrics. 1965;21(1):19-33. [Crossref]
- Yarnold JK. The minimum expectation in χ^2 goodness-of-fit tests and the accuracy of approximations for the null distribution. J Amer Statist Assoc. 1970;65(330):864-86. [Crossref]
- Lawal HB, Upton GJG. On the use of χ^2 as a test of independence in contingency tables with small cell expectations. Austral J Statist. 1984;26(l):75-85. [Crossref]
- Haberman SJ. A warning on the use of chi-squared statistics with frequency tables with small expected cell counts. JASA. 1988;83(402):555-60. [Crossref]
- Haviland MG. Yates's correction for continuity and the analysis of 2 x 2 contingency tables. Stat Med. 1990;9(4):363-7; discussion 369-83. [Crossref] [PubMed]
- Kroll NEA. Testing independence in 2x2 contingency tables. J Educ Stat. 1989;14(1):47-79. [Crossref]
- Yates F. Contingency tables involving small numbers and the χ^2 test. J R Stat Soc. 1934;1(2):217-35. [Crossref]
- Schouten HJA, Molenaar IW, Van Strik R, Boomsma A. Comparing two independent binomial proportions by a modified chi square test. Biom J. 1980;22(3):241-8. [Crossref]
- Haber M. The continuity correction and statistical testing. Int Stat Rev. 1982;50(2):135-44. [Crossref]
- Haber M. A comparison of some continuity corrections for the chi-squared test on 2x2 tables. JASA. 1980;75(371):510-5. [Crossref]
- Serra N. A significant minimization of Pearson's χ^2 statistics in 2x2 contingency tables: preliminary results for small samples. EBPH. 2018;15(3):e12949-1. [Crossref]
- Matchima K, Vongprasert J, Chutiman N. The development of a correction method for ensuring a continuity value of the chi-square test with a small expected cell frequency. J Sci Technol. 2018;26(1):98-105. [Link]
- Pearson K. On the criterion that a given system of deviations from the probable in the case of a correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling. Philos Mag. 1900;50(302):157-75. [Link]
- Fisher RA. The Design of Experiments. 1st ed. Edinburgh: Oliver and Boyd; 1935.
- Boschloo RD. Raised conditional level of significance for the 2x2 table when testing for the equality of two probabilities. Stat Neerl. 1970;21(1):1-35. [Link]
- Garside GR, Mack C. Actual type 1 error probabilities for various tests in the homogeneity case of the 2x2 contingency table. Am Stat. 1976;30(1):18-21. [Crossref]
- Pirie WR, Hamdan MA. Some revised continuity corrections for discrete distributions. Biometrics. 1972;28(3):693-701. [Crossref]
- Williams DA. Improved likelihood ratio tests for complete contingency tables. Biometrika. 1976;63(1):33-7. [Crossref]
- Upton GJG. A comparison of alternative tests for the 2x2 comparative trial. J R Stat Soc Ser A Stat Soc. 1982;145(1):86-105. [Crossref]
- Overall JE, Rhoades HM, Starbuck RR. Small-sample tests for homogeneity of response probabilities in 2 X 2 contingency tables. Psychol Bull. 1987;102(2):307-14. [Crossref] [PubMed]
- Plackett RL. The continuity correction in 2x2 tables. Biometrika. 1964;51:327-37. [Crossref]
- Grizzle JE. Continuity correction in the χ^2 test for 2x2 tables. Amer Statist. 1967;21(4):28-32. [Crossref]
- Liddell D. Practical tests of 2x2 contingency tables. The Statistician. 1976;25(4):295-304. [Crossref]
- Rhoades HM, Overall JE. A sample size correction for Pearson chi-square in 2x2 contingency tables. Psychol Bull. 1982;91(2):418-23. [Crossref]
.: Process List