13. Proporcijų lyginimas: suderinamumas

13.1 Empirinių ir teorinių proporcijų lyginimas

Ši tema yra glaudžiai susijusi su pasikliautinųjų intervalų skaičiavimu proporcijoms. Tad pirmiausia siūlau panagrinėti temą „10.3 Proporcijos PI“.

Griežtai matematiškai tema turėtų vadintis „hipotezės apie skirstinių/proporcijų lygybę tikrinimas.“ Kai norime patikrinti, ar empirinės proporcijos (ar santykiniai dažniai) nėra statistiškai reikšmingai nukrypusios nuo teorinių, galime rinktis iš kelių statistinių kriterijų. Mažoms imtims (n < 1000) arba kai netenkinamos kitiems kriterijams keliamos sąlygos, rekomenduojami tikslieji kriterijai. Didelėms imtims, kai tenkinamos visos reikiamos sąlygos, įprastai naudojami \(\chi^2\) arba \(G\) kriterijai.

Analizės eiga dažniausiai būna tokia:

  1. Suformuluojame analizės klausimą;
  2. Apskaičiuojame, kokios proporcijos turėtų būti teoriškai;
  3. Sudarome empirinių duomenų dažnių lentelę;
  4. Apskaičiuojame imties dydį \(n\);
  5. Pažiūrime, koks mažiausios grupės absoliutusis dažnis (pavadinkime jį \(f_{min}\));
  6. Pasirenkame vieną tinkamiausią statistinį kriterijų ir atliekame hipotezių tikrinimą.

Toliau galime nusibraižyti teorines proporcijas bei empirines proporcijas su pasikliautinaisiais intervalais. Galiausiai, aprašyti rezultatus.

Panagrinėkime pavyzdį. Sakykime, teoriškai apskaičiavome, kad fenotipų dažnis turi būti 1:1:1:1, o sudarę surinktų duomenų dažnių lentelę gavome 231:243:222:205. Ar šios empirinės proporcijos reikšmingai skiriasi nuo teorinių?

Pirmiausia, tiek empirines, tiek teorines proporcijas galime pasiversti į santykinius dažnius. Šiuo atveju gautume 0,250:0,250:0,250:0,250 ir 0,256:0,270:0,246:0,228. Toliau apskaičiuokime, kad bendras imties dydis \(n = 901\), o mažiausios empirinių duomenų grupės absoliutusis dažnis \(f_{min} = 205\). Kitas žingsnis, pasirinkti statistinį kriterijų ir atlikti statistinių hipotezių tikrinimą. Kokie tie kriterijai?

Lentelė 13.1: Teorinių dažnių apskaičiavimas sprendžiant suderinamumo uždavinį.
DydisSkaitinė išraiškaFormulė
Santykis \((f_i)\)1:1:1:1
Santykiniai dažniai \((f_i^{sant})\)0,250:0,250:0,250:0,250\(f_i^{sant} = f_i /\sum f_i\)
Imties dydis \((n)\)901\(n = \sum E_i\)
Teoriniai dažniai \((E_i)\)
(esant \(n=901\))
225,25:225,25:225,25:225,25\(E_i = n \cdot f_i^{sant}\)

13.1.1 Tikslusis binominis suderinamumo kriterijus

Jei turime lygiai dvi grupes, tada galima naudoti tikslųjį binominį kriterijų. Tinka ir didelėms imtims, bet rekomenduojama, kai imties dydis mažesnis už 1000. Bet kai imtis didelė, skaičiavimai gali užtrukti ilgai. Visgi, jei skaičiavimuose yra tik 2 grupės, net ir esant dideliam imties dydžiui, tikslusis binominis kriterijus turėtų būti naudojamas kaip \(\chi^2\) arba \(G\) kriterijų alternatyva, jei netenkinamos šiems dviems kriterijams keliamos sąlygos (žiūrėti žemiau).

Rezultatų pavyzdys

    Exact binomial test

data:  empirines_proporcijos[1] and is_viso
number of successes = 231, number of trials = 901, p-value = 0.6722
alternative hypothesis: true probability of success is not equal to 0.25
95 percent confidence interval:
 0.2281514 0.2862148
sample estimates:
probability of success 
             0.2563818 

Tarp kompiuterinės programos rezultatų turėtumėte pamatyti:

  • metodo pavadinimą (pvz., Exact binomial test),
  • mus dominančių įvykių skaičių (number of successes = 231),
  • įvykių skaičių iš viso (number of trials = 901),
  • \(p\) reikšmę (p-value = 0.6722),
  • alternatyvos rūšį (is not equal to, t.y., dvipusė alternatyva),
  • teorinę proporciją, su kuria lyginame (0.25).

Kiti galimi rezultatai:

  • empirinė mus dominančių įvykių proporcija (probability of success = 0.2563818),
  • šios proporcijos pasikliautinasis intervalas (95 percent confidence interval:, 0.2281514 0.2862148).

13.1.2 Tikslusis multinominis suderinamumo kriterijus

Tikslusis multinominis kriterijus tinka visais atvejais (pvz., ir kai turime daugiau nei dvi grupes, ir kai imtis didelė), bet rekomenduojama, kai imties dydis mažesnis už 1000. Kitu atveju skaičiavimai gali užtrukti ilgai. Visgi net esant dideliam imties dydžiui, kai grupių daugiau nei 2, tikslusis multinominis kriterijus turėtų būti naudojamas kaip \(\chi^2\) arba \(G\) kriterijų alternatyva, jei netenkinamos šiems dviems kriterijams keliamos sąlygos (žiūrėti žemiau).

Rezultatų pavyzdys

Tarp kompiuterinės programos rezultatų turėtumėte rasti bent jau \(p\) reikšmę.

13.1.3 \(\chi^2\) suderinamumo kriterijus

Chi kvadratu \((\chi^2)\) kriterijus tinka, jei kiekvienos grupės teorinis (tikėtinas) dažnis yra bent 5 atvejai ir iš viso bent 30 atvejų (t.y., \(n \ge 30\)). Kitaip tikimybių skaičiavimas pagal \(\chi^2\) skirstinį yra nekorektiškas. Teorinius dažnius įvertinti sudėtingiau, todėl kriterijų taikant praktiškai, įprastai žiūrima, kad kiekviename pogrupyje (t.y., ir pačiame mažiausiame) būtų bent 5 atvejai (geriau – bent 10). Rekomenduojamas, kai imtis didesnė nei 1000.

\(\chi^2\) statistikos skaičiavimas:

\[\begin{equation} \chi^2 = \sum_i \frac{(E_i - T_i)^2}{T_i} \tag{13.1} \end{equation}\]

Čia \(E_i\) – empirinis (stebimasis) dažnis, \(T_i\) (\(\ge 5\)) – teorinis (tikėtinas) dažnis. Kai turime pakankamai daug duomenų, \(\chi^2\) statistika ima skirstytis pagal \(\chi^2\) skirstinį su \(k-1\) laisvės laipsnių (\(k\) – kategorijų/grupių skaičius).

Rezultatų pavyzdys

    Chi-squared test for given probabilities

data:  empirines_proporcijos
X-squared = 3.4129, df = 3, p-value = 0.3322

Tarp kompiuterinės programos rezultatų turėtumėte pamatyti:

  • metodo pavadinimą (pvz., Chi-squared test),
  • \(\chi^2\) statistikos reikšmę (X-squared = 3.4129),
  • \(\chi^2\) skirstinio parametro reikšmę (df = 3),
  • \(p\) reikšmę (p-value = 0.3322).

13.1.4 G suderinamumo kriterijus

\(G\) kriterijus (angl. G-test) dar vadinamas tikėtinumų santykio (angl. Log likelihood ratio) kriterijumi. Tinka toms pačioms situacijoms kaip ir \(\chi^2\) kriterijus ir dažnai yra tik „skonio“ ar asmeninių nuostatų dalykas, kurį kriterijų rinktis. Visi dažniai privalo būti teigiami (nenuliniai). Rekomenduojamas, kai imtis didesnė nei 1000.

\(G\) statistikos skaičiavimas:

\[\begin{equation} G = 2 \sum_i \left( E_i \cdot ln\left(\frac{E_i}{T_i}\right) \right) \tag{13.2} \end{equation}\]

Čia \(E_i\) (\(\ge 0\)) – empirinis dažnis, \(T_i\) (\(> 0\)) – teorinis dažnis, taip kad:

\[\begin{equation} n = \sum \limits_i E_i = \sum \limits_i T_i \tag{13.3} \end{equation}\]

Čia \(n\) – imties dydis.

Kai turime pakankamai daug duomenų, \(G\) statistika ima skirstytis pagal \(\chi^2\) skirstinį su \(k-1\) laisvės laipsnių (\(k\) – kategorijų/grupių skaičius).

Rezultatų pavyzdys

    Log likelihood ratio (G-test) goodness of fit test

data:  empirines_proporcijos
G = 3.4337, X-squared df = 3, p-value = 0.3295

Tarp kompiuterinės programos rezultatų turėtumėte pamatyti:

  • metodo pavadinimą (pvz., Log likelihood ratio (G-test) goodness of fit test),
  • \(G\) statistikos reikšmę (G = 3.4337),
  • \(\chi^2\) skirstinio parametro reikšmę (X-squared df = 3),
  • \(p\) reikšmę (p-value = 0.3295).

13.1.5 Pastabos

Kaip matome iš lygčių (13.1) ir (13.2), \(\chi^2\) bei \(G\) statistikų reikšmės yra standartizuotas skirtumas tarp teorinių ir empirinių dažnių (prisiminkime, kad dalyba logaritminėje erdvėje gali būti pakeista logaritmų skirtumu). Jos asimptotiškai artėja prie \(\chi^2\) skirstinio (kaip skaičiuojami laisvės laipsniai – neapibrėšime), kai imties dydis \(n \to \infty\).

13.1.6 Rekomenduojami informacijos šaltiniai

Informacijos šaltiniai

Cornell B. Chi Squared Test. (2016). Prieiga per internetą: https://ib.bioninja.com.au/higher-level/topic-10-genetics-and-evolu/102-inheritance/chi-squared-test.html.
Mangiafico S.S. Chi-square Test of Goodness-of-Fit. An R Companion for the Handbook of Biological Statistics. New Brunswick, NJ: Rutgers Cooperative Extension. (2015a). Prieiga per internetą: https://rcompanion.org/rcompanion/b_03.html.
Mangiafico S.S. Exact Test of Goodness-of-Fit. An R Companion for the Handbook of Biological Statistics. New Brunswick, NJ: Rutgers Cooperative Extension. (2015b). Prieiga per internetą: https://rcompanion.org/rcompanion/b_01.html.
Mangiafico S.S. G–test of Goodness-of-Fit. An R Companion for the Handbook of Biological Statistics. New Brunswick, NJ: Rutgers Cooperative Extension. (2015c). Prieiga per internetą: https://rcompanion.org/rcompanion/b_04.html.
McDonald J.H. Chi-square test of goodness-of-fit. Handbook of Biological Statistics. Baltimore, Maryland: Sparky House Publishing. (2014a). Prieiga per internetą: http://www.biostathandbook.com/chigof.html.
McDonald J.H. Exact test of goodness-of-fit. Handbook of Biological Statistics. Baltimore, Maryland: Sparky House Publishing. (2014f). Prieiga per internetą: http://www.biostathandbook.com/exactgof.html.
McDonald J.H. G–test of goodness-of-fit. Handbook of Biological Statistics. Baltimore, Maryland: Sparky House Publishing. (2014h). Prieiga per internetą: http://www.biostathandbook.com/gtestgof.html.