12. HT uždavinių tipai

Šiame skyriuje bus apibendrintai pristatomi svarbiausi uždaviniai, kuriuos sprendžiame tikrindami statistines hipotezes (HT), ir pateikiamos nuorodos į resursus, kaip išsirinkti reikiamą analizės metodą.

Pagrindinės uždavinių, kurių sprendimui gali būti pasitelktas statistinių hipotezių tikrinimas, grupės yra šios:

  1. ryšio tarp kintamųjų įvertinimas;
  2. skirtumo tarp grupių įvertinimas;
  3. skirstinių formos atitikimo (suderinamumo) įvertinimas.

Sakydami „įvertinimas“ įprastai turime omenyje bent 2 dalykus:

  1. statistinio reikšmingumo tikrinimas:
    • pvz., „Ar pakanka duomenų teigti, kad skirtumas tarp dviejų grupių, kurį matome iš duomenų, iš tiesų egzistuoja ir generalinėje aibėje? Ar galime teigti, kad iš duomenų matomas skirtumas yra ne atsitiktinis? Ar pakanka pagrindo teigti, kad atradome naują reiškinį?“
  2. efekto dydžio vertinimas:
    • pvz., „Kokio dydžio tas skirtumas? Ar jis yra pakankamai didelis, kad būtų naudingas arba praktiškai svarbus?“

Dabar kiekvieną uždavinių grupę aptarkime šiek tiek plačiau.

12.1 Ryšys tarp kintamųjų: bendrieji principai

Ryšys (arba sąsaja) tarp kintamųjų yra toks reiškinys, kai žinodami vieno kintamojo reikšmę, gauname informacijos apie galimą kito kintamojo reikšmę. Žiūrint grynai iš techninės pusės, tai ryšio tarp 2 (ar kelių) duomenų lentelės stulpelių ieškojimas (vadinasi, atliekant tokią analizę eilučių skaičius kiekviename iš stulpelių turi būti vienodas). Vienas iš tokios analizės tipų yra koreliacinė analizė, kuri gali atskleisti, kad, pvz., vieno kintamojo reikšmėms didėjant, tikėtina, jog didės ir kito kintamojo reikšmės (jei kintamieji kiekybiniai). Taip pat dažnai naudojama ryšio tarp kategorinių kintamųjų analizė, kuri gali parodyti, kad jei kintamojo X reikšmė yra „a“, tada labiau tikėtina, kad kintamojo Y reikšmė bus „b“, o ne „g“.

Sąsajos tarp kintamųjų analizė gali padėti atsakyti į klausimą, ar yra ryšys:

  • tarp į terpę įdėtos gliukozės kiekio ir ląstelių dydžio,
  • tarp padarytų pritūpimų skaičiaus ir pulso dažnumo,
  • tarp ląstelių rūšies ir dydžio (didelės/mažos),
  • tarp mėgintuvėlio formos ir susidariusios tirpalo spalvos (geltona, mėlyna, žalia),
  • tarp valandų skaičiaus besirengiant atsiskaitymui ir pažymio,
  • tarp rūkymo statuso (rūko/nerūko) ir padidėjusios širdies ir kraujagyslių ligų rizikos grupės (įprastinė/padidėjusi rizika).

12.1.1 Sąsaja neparodo priežastingumo

Atliekant sąsajos tarp kintamųjų analizę, svarbu prisiminti, kad jei rezultatai rodo, kad du dydžiai yra susiję (koreliuoja), tai nereiškia, kad vienas sukelia kitą (nors iš pirmo žvilgsnio gali taip atrodyti). Tad:

Nustatyta sąsaja tarp kintamųjų pati savaime neparodo priežastingumo.

Taip pat:

Koreliacija pati savaime neparodo priežastingumo.

Skirtumas tarp šių sąvokų (sąsaja ir priežastis) puikiai iliustruojamas video epizoduose „How Ice Cream Kills! Correlation vs. Causation“ bei „The danger of mixing up causality and correlation“ .

Tai, kad dviejų kintamųjų reikšmės yra susijusios (pvz., koreliuoja), dar nereiškia, kad vienas kintamasis yra kito kintamojo priežastis. Norint pagrįsti priežastingumą, be ryšio stiprumo būtinai reikia pagrįsti dar bent 2 dalykus, jog:

  1. abu tiriamieji reiškiniai yra nutolę laike, t.y., vyksta ne tuo pačiu metu,
  2. tas reiškinys, kuris laikomas priežastimi, visada įvyksta anksčiau nei tas, kuris laikomas pasekme.

Deja, nei koreliacinė, nei kitokia požymių nepriklausomumo analizė savaime šių dalykų neparodo. Analizės rezultatai gali atskleisti tik tai, kad kintant vieno požymio reikšmėms, tikėtina, kis ir kito požymio reikšmės. Norint daryti priežastinio tipo išvadas būtinas tikslingai suplanuotas eksperimentas.

Priežastinį ryšį galima atskleisti tik tikslingai suplanuotu eksperimentu.

Be to, dažna situacija, kad abudu mūsų tiriamieji kintamieji yra trečiojo, tyrime netiriamo kintamojo pasekmė.


Plačiau apie koreliaciją ir priežastingumą taip pat rašoma skyriuje „2.2.3 Koreliacija neparodo priežastingumo“.

12.1.2 Statistinis reikšmingumas: sąsaja

Norint patikrinti, ar ryšys tarp kintamųjų yra statistiškai reikšmingas, tikrinama statistinė hipotezė, kuri bendruoju atveju, gali būti formuluojama taip:

  • \(H_0\): dviejų požymių reikšmės nėra susijusios (sąsajos stiprumas lygus nuliui);
  • \(H_1\): dviejų požymių reikšmės yra susijusios (sąsajos stiprumas nelygus nuliui).

„Požymių reikšmės susijusios“ reiškia, kad žinodami vieno požymio reikšmes (ir jų kitimą) gauname papildomos informacijos ir apie kito požymio reikšmes (ir jų kitimą). Pvz., kad padidėjus vieno kintamojo reikšmėms (pvz., atliktų pritūpimų skaičiui), tikėtina, padidės ir kito kintamojo (pvz., pulso dažnis) reikšmės.

Jei reikšmingumo lygmuo \(\alpha = 0{,}05\), tai, kai:

  • \(p \ge 0{,}05\), teigti, kad požymiai susiję negalime (neatmetame \(H_0\), ryšys statistiškai nereikšmingas). Bet būtų klaidinga teigti, kad „ryšio nėra“ (jis tiesiog „statistiškai nereikšmingas“);
  • \(p < 0{,}05\), teigiame, kad požymiai susiję (priimame \(H_1\), sąryšis statistiškai reikšmingas).

Koreliacinės analizės, kuri yra skirta įvertinti tiesinį (arba monotoninį) ryšį tarp skaitinių (arba ranginių) kintamųjų, atveju statistines hipotezes galima formuluoti taip:

  • \(H_0\): koreliacijos koeficientas lygus nuliui, koreliacijos nėra;
  • \(H_1\):
    • koreliacijos koeficientas nelygus nuliui, kintamieji yra koreliuoti (dvipusė alternatyva);
    • koreliacijos koeficientas mažesnis už nulį, kintamieji yra neigiamai koreliuoti (vienpusė alternatyva);
    • koreliacijos koeficientas didesnis už nulį, kintamieji yra teigiamai koreliuoti (vienpusė alternatyva).

Galimos ir vienpusės alternatyvos: koreliacijos koeficientas mažesnis už nulį, kintamieji koreliuoti neigiamai (vienpusė alternatyva); koreliacijos koeficientas didesnis už nulį, kintamieji koreliuoti teigiamai (vienpusė alternatyva). Nors yra 3 alternatyvų variantai, jei neturime pagrindo rinktis kitaip, įprastai renkamės dvipusę. Vienpusės alternatyvos pasitaiko rečiau nei dvipusės, tad vienpusių šio kurso metu neakcentuosiu.

Jei neturite objektyvaus pagrindo daryti kitaip, privalote rinktis dvipusę alternatyvą.

12.1.3 Efekto dydis: sąsajos stiprumas

Rezultatai gali tapti statistiškai reikšmingi vien tik dėl to, kad imties dydis labai didelis, nors efektas yra mažas. Dėl to be statistinio reikšmingumo reiktų nurodyti ir efekto dydį.

Efekto dydis šios analizės metu yra sąsajos stiprumas. Jį parodo koreliacijos koeficientas (Pearson \(\varrho\), Spearman \(\varrho_s\), Kendall \(\tau\)) ar kitoks ryšio tarp kintamųjų matas (Cramer \(V\), Kruskal-Goodman \(\tau\) ar \(\lambda\)). Tiems koeficientams, kuriuos mokomės šio kurso metu, galioja tokios taisyklės:

  • kuo absoliučioji koeficiento vertė didesnė, tuo priklausomybė tarp kintamųjų reikšmių yra stipresnė;
  • įprastai maksimali absoliučioji koeficientų vertė būna 1 (t.y., \(|1|\) arba \(|-1|\), čia \(|...|\) – modulio ženklas);
  • kuo ši vertė arčiau nulio, tuo matuojamo tipo sąsaja yra silpnesnė.

Koreliacijos koeficiento tipo koeficientų (Pearson \(\varrho\), Spearman \(\varrho_s\), Kendall \(\tau\), Cramer \(V\)) negalima interpretuoti tiesiškai: pvz., lyginant Pearson koeficiento įverčius \(r = 0{,}3\) ir \(r = 0{,}6\) negalima teigti, kad antrasis rodo dvigubai stipresnį ryšį, nei pirmasis.

Jei \(r\) arba \(r_s\) koeficientus pakelsime kvadratu, tai koeficientų kvadratai parodys atitinkamai paaiškintos duomenų dispersijos \((r^2)\) bei rangų dispersijos \((r_s^2)\) dalį. Tad šiuos koeficientus jau galime interpretuoti tiesiškai: \(r = 0{,}71\) maždaug 2 kartus stipresnį ryšį, nei \(r = 0{,}50\). Kendall \(\tau\) ar Cramer \(V\) koeficientams šitokia interpretacija (pakėlus kvadratu) negalioja.

Tuo tarpu Kruskal-Goodman koeficientai \(\tau\) ar \(\lambda\) parodo, kiek sumažėja klasifikacijos klaida lyginant su visiškai atsitiktiniu spėjimu: 0 – sumažėja 0%, 1 – sumažėja 100%. Todėl šio tipo koeficientų reikšmes tikimybine prasme interpretuoti paprasčiau nei, pvz., Cramer \(V\).

Taip pat galimi ir kitokie efekto dydžio matai, pvz., nominaliesiems duomenims: entropijos koeficientas, santykinė rizika, galimybių santykis ir kiti.

Apie \(r^2\) tipo koeficientus siūlau pažiūrėti mokomąjį video: „StatQuest: R-squared explained“ .

12.2 Skirtumas tarp grupių

Skirtumo tarp grupių vertinimas – uždavinių grupė, kai pagal turimus duomenis norime įvertinti, ar vieno kintamojo (atsitiktinio dydžio) reikšmės pagal tam tikrą charakteristiką statistiškai skiriasi keliuose pogrupiuose.

Žiūrint techniškai, jei duomenys pateikti ilguoju duomenų lentelės formatu, tai mes turime vieną tiriamąjį (atsako) kintamąjį (stulpelį), kuriame gali būti arba kiekybiniai arba kokybiniai duomenys, ir vieną grupavimo kintamąjį (stulpelį), pagal kurio reikšmes nustatome, kuriam pogrupiui (grupei, imčiai) priklauso lentelės eilutė. (Aišku, tų kintamųjų gali būti ir daugiau, čia aprašiau tik bazinį variantą, su kokiu dirbsime šio kurso metu). Tad, galima sakyti, grupių lyginimo atveju mes lyginame skirtingas duomenų lentelės eilutes (prisiminkite, ką lyginame ryšio tarp kintamųjų analizės atveju).

Pagal grupių (pogrupių, imčių) skaičių įprastiniai variantai, kai lyginame vieną pogrupį su konkrečia reikšme (t.y., kai realių grupių neturime), kai lyginame lygiai 2 pogrupius, arba kai tiriame kelis (įprastai 3 ar daugiau) pogrupius. Jei atsako kintamasis yra kiekybinis, grupes lyginti (t.y., skirtumų ieškoti) galime pagal kurį nors kiekybinių duomenų skirstinio parametrą (vidurkį, dispersiją) ar abstraktesnį dalyką, pvz., skirstinio kurioje nors iš grupių „polinkį“ įgyti didesnes ar mažesnes reikšmes. Jei atsako kintamasis yra kategorinis, tada susidarome dažnių lentelę ir lyginame proporcijas tarp grupių.

Tad akcentuoju, kad šiai uždavinių grupei taip pat priskirčiau uždavinius:

  • kai turime vieną pogrupį (kas iš esmės reiškia, kad grupių nėra) ir jį lyginame su kokiu nors teoriniu skaičiumi;
  • kai norima išsiaiškinti, ar yra skirtumas tarp proporcijų skirtinguose pogrupiuose (kas reiškia, kad atsako kintamasis yra kategorinis);
  • kai lyginamas santykis, o ne skirtumas, nes matematiškai, jei \(A/B = 1\), tai \(A - B = 0\).

Be abejo, į šio tipo uždavinius galima pažiūrėti ir abstrakčiau. Tam tikra prasme šio tipo analizė parodo, ar yra ryšys tarp kategorinio ir tolydžiojo kintamojo – ar pagal vieno kintamojo reikšmes gauname informacijos apie kito kintamojo reikšmes: jei, pvz., vienos grupės reikšmės yra linkusios būti didesnės (t.y., reikšmingai skiriasi), tai ryšys yra, jei skirtumo tarp grupių nėra, tai žinodami, kuriam pogrupiui priklauso stebėjimas, negauname papildomos informacijos apie galimas kito kintamojo reikšmes tad ir ryšio nėra. Čia tarsi apie tą patį dalyką klausti iš kitos pusės. Pvz., (a) „Ar yra ryšys tarp lyties ir vidutinio ūgio?“, (b) „Ar vidutiniai vyrų ir moterų ūgiai skiriasi?“ – abiejų klausimų esmė ta pati, bet vienas akcentuoja ryšį tarp 2 kintamųjų, antrasis – kiekybinio kintamojo reikšmių skirtumus tarp dviejų pogrupių. Tad jeigu išgirsite klausimą, kurio esmė – patikrinti, ar yra ryšys tarp kategorinio ir kiekybinio kintamųjų, tai žinokite, kad iš tiesų reikia rinktis metodus, kurie sprendžia skirtumo tarp grupių uždavinį.

12.2.1 Statistinis reikšmingumas: skirtumas

Bendruoju atveju naudojamos tokios statistinės hipotezės:

  • \(H_0\): skirtumo nėra (skirtumas lygus nuliui);
  • \(H_1\):
    • skirtumas yra (skirtumas nelygus nuliui; dvipusė alternatyva).
    • (taip pat galimos vienpusės alternatyvos, bet jos naudojamos rečiau, tad jų šio kurso metu neakcentuosiu).

Jei reikšmingumo lygmuo \(\alpha = 0{,}05\), tai, kai:

  • \(p\ge0{,}05\), teigiame, kad skirtumas yra statistiškai nereikšmingas ir nulinės hipotezės \(H_0\) atmesti nėra pagrindo, užregistruotą skirtumą galime paaiškinti vien tik atsitiktinumu. Bet klaidinga teigti, kad „skirtumo nėra“ (jis tiesiog „statistiškai nereikšmingas“).
  • \(p<0{,}05\), teigiame, kad skirtumas tarp vidurkių yra statistiškai reikšmingas.

12.2.2 Efekto dydis: skirtumo dydis, paaiškinta kitimo dalis

Rezultatai gali tapti statistiškai reikšmingi vien tik dėl to, kad imties dydis labai didelis. Dėl to be statistinio reikšmingumo reiktų nurodyti ir efekto dydį.

Šio tipo uždaviniuose efekto dydis kokiu nors būdu atspindi skirtumo tarp grupių didumą. Tas „skirtumas“ būna paprastasis (nestandartizuotas) arba standartizuotasis. Jei tinka, pravartu atsakymą nurodyti abiem formomis, nes, priklausomai nuo situacijos, kiekviena forma gali turėti savo privalumų.

Galime skaičiuoti paprastuosius ir standartizuotuosius efekto dydžius.

Atlikdami mokslinius darbus tyrėjai dažnai pamiršta nurodyti efekto dydį. Venkite šitos klaidos!

Nepaisant to, kokia \(p\) reikšmė buvo gauta, tyrėjai privalo tarp rezultatų pateikti ir efekto dydį (Durlak 2009).

Efekto dydis kintamojo matavimo vienetais

Paprastasis (nestandartizuotasis) efekto dydis matuojamas tais pačiais matavimo vienetais, kaip ir tiriamas kintamasis. Lyginant padėtį – tai gali būti skirtumas tarp grupių vidurkių (simetriškiems duomenims) ar medianų (jei grupių skirstinių forma vienoda), kai šie dydžiai pakankamai gerai reprezentuoja skirstinio centrą. Ypač tinkamas, jei mums aiški tiriamo dydžio pradiniais matavimo vienetais pokyčio reikšmė, pvz., vidutinis masės sumažėjimas 5 kg per tam tikrą laikotarpį reguliariai atliekant naująją mankštą, koncentracijos kitimas 0,8 \(\mu mol/l\) ar pan.

Standartizuotieji efekto dydžio matai

Skaičiuojant standartizuotuosius efekto dydžio matus panaikinami matavimo vienetai, dydžiai tampa bedimensiai (standartizuoti). Tai leidžia palyginti skirtingus kintamuosius ar skirtingais matavimo vienetais matuojamus dydžius skirtingų tyrimų metu.

Standartizuotieji efekto dydžiai būna dviejų tipų:

  1. r tipo (angl. ratio arba relationship) – tai efekto dydis, panašus į koreliacijos koeficientą. Jis parodo ryšio tarp kintamųjų stiprumą. Čia galimi du potipiai:
    1. r tipas (nepakeltas kvadratu). Interpretacija: kai 0 – ryšio nėra, kai \(|r|=1\), idealus ryšys. Kuo absoliučioji reikšmė didesnė, tuo ryšys stipresnis. Šio tipo efekto dydžio (kaip ir koreliacijos koeficiento) reikšmių nereiktų interpretuoti tiesiškai: t.y., \(r=0{,}4\) nerodo, kad ryšys yra dvigubai stipresnis už \(r=0{,}2\).
    2. tipas (pakelta kvadratu) – paaiškinta kitimo dalis. Šių efekto dydžių kvadratas (dažniausiai žymimas \(r^2\), \(\eta^2\) ar \(\omega^2\)) įprastai rodo, kuri priklausomo kintamojo dispersijos (viso kitimo) dalis paaiškinama nepriklausomo kintamojo reikšmėmis (0 – paaiškinta 0%, 1 – paaiškinta 100%). T.y., kurią dalį duomenų sklaidos lemia grupių skirtumai (Čekanavičius ir Murauskas 2004, p.71), o ne atsitiktinumas ar kiti faktoriai.
  2. d tipo (angl. difference) – naudojami kartu su \(t\) kriterijais (skaičiuojamas skirtumas tarp 2 grupių ar tarp vienos grupės ir konstantos) ir įvertina skirtumą standartiniais nuokrypiais. Koeficientai dažnai žymimi raidėmis \(d\) ar \(g\), efekto dydį (stiprumą) parodo reikšmių modulis (\(|d|\)). Jei koeficiento reikšmė lygi 0, tai skirtumo (efekto) nėra. Mažiausia ir didžiausia reikšmė nėra apibrėžtos.

Standartizuotųjų efekto dydžių interpretacija

Pirmiausia, \(d\) tipo efekto dydžio reikšmės kinta \((-∞;~ +∞)\) srityje. Ypatingasis taškas yra 0, kai skirtumo nėra. Ženklo kryptis nurodo skirtumo dydį. Skaitinė išraiška nurodo skirtumą standartiniais nuokrypiais. Cohen (1988) preliminariai siūlo standartizuotųjų skirtumų (d) koeficientus interpretuoti taip: 0-0,2 itin mažas, 0,2-0,5 mažas, 0,5-0,8 vidutinis, >0,8 didelis efektas.

Kalbant apie r tipo koeficientus (nepakėlus kvadratu) – jie kinta srityje [-1; +1], ypatingasis taškas yra 0, kur ryšio (skirtumo) nėra. Parametriniams metodams skaitinės reikšmės absoliutusis dydis gali būti interpretuojamas taip: 0-0,1 itin mažas, 0,1-0,3 mažas, 0,3-0,5 vidutinis, >0,5 didelis efektas (Cohen (1988)). (Pastaba: Cohen (Kohenas) yra socialinių mokslų atstovas).

Kvadratu pakeltų ( tipas) koeficientų kitimo ribos yra [0; +1]. Galima interpretacija: 0,01 – mažas, 0,06 – vidutinis, 0,14 – didelis (Field ir kt. 2012, p.455), kitų autorių teigimu, \(\omega^2\) > 0,15 – pakankamai didelis efektas (Čekanavičius ir Murauskas 2004, p.74).

Skirtingų autorių siūlymus, kaip interpretuoti įvairius efekto dydžius, galite rasti čia . Tačiau tai labai subjektyvūs vertinimai: kas vienoje mokslo srityje ar vieno tyrimo metu yra „didelis“ efekto dydis, kitoje situacijoje gali būti „mažas“. Tad tiksliau reiktų vertinti savo darbą lyginant su kitų jūsų srities tyrėjų darbais.

Efekto dydį kaip „mažą“ ar „didelį“ interpretuokite atsargiai. Visada nurodykite skaitinę išraišką.

12.3 Suderinamumo uždavinys

Suderinamumo (angl. goodness-of-fit) vertinimas – tai kelių skirstinių formos lyginimas siekiant nustatyti, ar jie pakankamai gerai atitinka (t.y., ar yra suderinami). Statistiniai suderinamumo kriterijai – tai kriterijai, kurie padeda įvertinti, ar skirtumas tarp dviejų skirstinių formos yra statistiškai reikšmingas. Labai dažnai vertinamas suderinamumas tarp teorinio skirstinio (modelio) ir empirinių duomenų pasiskirstymo. Tačiau galima lyginti ir kelis empiriškai gautus skirstinius. Suderinamumo vertinimo metodus galima skirstyti į kelias grupes:

  1. metodai skirti diskretiesiems/nominaliesiems duomenims, kai sudaromos dažnių lentelės (kas ir yra empirinis skirstinys), kurios lyginamos su teoriniais dažniais. Pvz., teoriškai apskaičiuotų ir eksperimentiškai gautų fenotipinių požymių dažnių lyginimas genetikoje norint patikrinti, ar teorinės prielaidos yra teisingos.
  2. metodai skirti tolydiesiems ir kitokiems kiekybiniams duomenims. Dažniausiai pasitaikantis šio tipo analizės pavyzdys – pasiskirstymo normalumo prielaidos tikrinimas.

12.3.1 Statistinis reikšmingumas

Tiriant suderinamumą, statistinės hipotezės formuluojamos daugmaž taip:

  • \(H_0\): skirstiniai suderinami (nuokrypis tarp skirstinių formos lygus nuliui);
  • \(H_1\): skirstiniai nesuderinami (yra neatitikimas tarp skirstinių formos).

Statistinės išvados priėmimo taisyklės analogiškos anksčiau minėtosioms. Sakykime \(\alpha = 0{,}05\):

  • jei \(p \ge 0{,}05\), tada neturime pagrindo atmesti \(H_0\): neatitikimas tarp pasiskirstymo formos yra statistiškai nereikšmingas, negalime teigti, kad skirstinių forma skiriasi, skirstinių suderinamumo prielaida tenkinama. Bet klaidinga teigti, kad „skirstiniai yra vienodi“ (skirtumas tarp jų yra tiesiog „statistiškai nereikšmingas“).
  • jei \(p < 0{,}05\), neatitikimas tarp pasiskirstymo formos yra statistiškai reikšmingas, skirstiniai nėra suderinami.

12.3.2 Efekto dydis

Spręsdami suderinamumo uždavinį efekto dydį dažniausiai vertiname iš grafikų: įprastinių (branduolių tankio, stulpelinių, sukauptojo santykinio dažnio ar kitokių diagramų) ar specializuotų (kvantilių palyginimo QQ, tikimybių palyginimo PP grafikų).

12.4 Schemos metodams pasirinkti

Aptarėme tris bendrąsias uždavinių grupes. Kiekvienoje iš jų yra bent po keletą konkretesnių uždavinių, o kiekvienam uždaviniui spręsti, priklausomai nuo duomenų savybių, gali būti net ir keletas metodų. Schemos ir/arba aprašymai, kurie padeda pasirinkti reikiamą statistinį kriterijų ar kitokį analizės metodą, bus pateikti tolimesniuose skyriuose. Nuorodos į šias schemas ir aprašymus pagal konkretų uždavinio tipą:

  • (I) Kategorinių (nominaliųjų) duomenų analizė:
    1. proporcijų analizė:
      1. empirinių ir teorinių proporcijų lyginimas (suderinamumo uždavinys): skyrius 13.1;
      2. empirinių proporcijų lyginimas tarp kelių grupių (populiacijų homogeniškumo uždavinys): skyrius 14.1.
    2. ryšio tarp kintamųjų analizė:
      1. ryšio tarp nominaliųjų kintamųjų analizė: skyrius 15.
  • (II) Kiekybinių (tolydžiųjų) duomenų analizė:
    1. normalumo prielaidos tikrinimas (suderinamumo uždavinys): schema 16.3;
    2. sklaidos (dispersijų) lyginimas, lygių dispersijų prielaidos tikrinimas: schema 17.1;
    3. skirstinių padėties (pvz., vidurkių) lyginimas:
      1. pradinė bendroji schema 18.1;
      2. 1 ar 2 grupėms (imtims): schema 18.2;
      3. kelioms nepriklausomoms grupėms (imtims): schema 19.1;
      4. kelioms priklausomoms grupėms: šiame kurse nesimokome;
      5. daugiafaktorinių eksperimentų duomenims: šiame kurse nesimokome.
    4. ryšio tarp kintamųjų analizė:
      1. koreliacinė (ryšio tarp kiekybinių kintamųjų) analizė: schema 20.2;
      2. tiesinė regresinė analizė: skyrius 21.
  • (III) Norima sudaryti kintamuosius siejančią lygtį, prognozuoti:
    1. tiesinė regresinė analizė: skyrius 21.
  • Yra ir daugiau galimų uždavinių tipų, bet apie juos šiame kurse nesimokome.

Įprastai minėtose schemose naudojamas pav. 12.1 pavaizduotas ženklinimas.

Įprastinis schemų, skirtų pasirinkti statistinius kriterijus, elementų spalvinis ženklinimas.

Pav. 12.1: Įprastinis schemų, skirtų pasirinkti statistinius kriterijus, elementų spalvinis ženklinimas.

Šiose schemose pateikti tik mūsų kurse nagrinėjami metodai. Norėdami išsamesnės, papildančios ar alternatyvios metodikos, kaip pasirinkti analizės metodus, galite naudoti šaltinius:

  1. Pasirinkimų lentelė su nuorodom į metodų aprašymą iš vadovėlio (McDonald 2014c).
  2. Interaktyvi metodo pasirinkimo schema (Jackson 2016), pateikianti siūlymus, kokį metodą naudoti ir kaip atlikti programomis „R“, „SPSS“ ir „Stata“. Rezultatai turėtų būti panašūs kaip ir naudojantis vadovėlyje (Field 2016, p.958) esančia schema.
  3. Schema iš vadovėlio (Čekanavičius ir Murauskas 2004, p.271) („Statistinių metodų schema“).

Informacijos šaltiniai

Čekanavičius V., Murauskas G. Statistika ir jos taikymai II. Vilnius: TEV (2004).
Cohen J. Statistical power analysis for the behavioral sciences.Routledge (1988).
Durlak J.A. How to Select, Calculate, and Interpret Effect Sizes, Journal of Pediatric Psychology 34(9): 917–928 (2009). DOI: 10.1093/jpepsy/jsp004.
Field A. An Adventure in Statistics: The Reality Enigma. London: Sage (2016). Prieiga per internetą: https://us.sagepub.com/en-us/nam/discovering-statistics/book237529.
Field A., Miles J., Field Z. Discovering Statistics Using R. London: Sage (2012). Prieiga per internetą: https://us.sagepub.com/en-us/nam/discovering-statistics-using-r/book236067.
Jackson M. An interactive stats flowchart / decision tree to help you choose an appropriate statistical test. (2016). Prieiga per internetą: http://www.statsflowchart.co.uk/.
McDonald J.H. Choosing a statistical test. Handbook of Biological Statistics. Baltimore, Maryland: Sparky House Publishing. (2014c). Prieiga per internetą: http://www.biostathandbook.com/testchoice.html.