3. Tyrimų planavimas

Jūsų užduotis:

  • išstudijuoti pateiktą medžiagą,
  • atkreipti dėmesį tiek į anglišką, tiek į lietuvišką terminiją,
  • suprasti pagrindines sąvokas ir principus.

Generalinė aibė (GA) – tai visi tyrėją dominantys objektai, apie kuriuos norima daryti išvadas. Deja, įprastai neturime galimybių ištirti visą GA. Be to, analogišką rezultatą galime pasiekti ištyrę tik dalį GA. Tad imtis – tai GA dalis, naudojama statistiniam tyrimui. T.y., į tyrimą patekę objektai. Taikant aprašomosios statistikos metodus galima statistiškai apibūdinti bet kokią imtį (nekreipiant dėmesio į atsitiktinumą, atsirandantį sudarant imtį) ar net visą generalinę aibę (GA). Įtraukiant elementus (tiriamuosius) į imtį visą laiką egzistuoja atsitiktinumo elementas, todėl norint pagal imties duomenis daryti pagrįstas išvadas apie visą GA (t.y., statistines išvadas, angl. statistical inference), būtina sąlyga, kad imtis būtų reprezentatyvi (pagrindinis reikalavimas) ir tikimybinė (objektyviai apibrėžtas atsitiktinumas). Reprezentatyvi imtis – tai imtis, kuri pagal tiriamuosius požymius yra tarsi maža GA kopija, nes gerai (proporcingai) atitinka GA struktūrą. Tam, kad gerai atitiktų GA struktūrą, imtis privalo būti ir pakankamai didelė. Tikimybinė imtis – tokia imtis, kuri sudaryta grindžiant tikimybių teorijos principais, todėl atsitiktinumas patekti į imtį yra objektyviai apibrėžtas. T.y., jei imtis yra tikimybinė, tai kiekvienam GA elementui (tiriamajam) yra aiškiai apibrėžta galimybė patekti į imtį. Tam, kad būtų tenkinamos šios sąlygos, tyrimas turi būti tinkamai suplanuotas ir įvykdytas. Tai taip pat reiškia, kad imtis privalo būti sudaryta tinkamu būdu.

Įprastai, kai kiekvienas tiriamasis į imtį patenka visiškai atsitiktinai (atsitiktinė imtis), imtis būna reprezentatyvi ir tikimybinė.

Šiame skyriuje susipažinsime su kai kuriais tyrimų planavimo aspektais, panagrinėsime, kokiais būdais sudaromos imtys, kaip jos klasifikuojamos, kodėl reikia skirtingų sudarymo būdų, kokie jų privalumai ir ribotumai.

3.1 Sąvokos

Apžvelkime kai kurias su tyrimų planavimu susijusias sąvokas.


Tyrimai (pagal tyrėjo daromą poveikį):

  • Stebėjimo tyrimas (angl. observational study) – toks tyrimas, kai duomenys yra renkami nedarant poveikio analizuojamai sistemai.
  • Eksperimentas (angl. experiment) – toks tyrimas, kai analizuojamai sistemai tyrėjas daro poveikį ir yra stebimas atsakas į tą poveikį. (Plačiau skaitykite skyriuje „3.2 Tyrimas ir eksperimentas“).
  • T.p. žiūrėti „3.2 Tyrimas ir eksperimentas“.


Tyrimai (pagal apklaustųjų skaičių):

  • Surašymas (angl. census) – toks (įprastai socialinis) tyrimas, kai apklausiama (surašoma) visa GA.
  • Apklausa (angl. survey) – toks (įprastai socialinis) tyrimas, kai apklausiama tyrimui atrinkta imtis.


Tyrimo planas:

  • Eksperimento/Tyrimo planavimas (plačiąja prasme, angl. research plan) – tai visi etapai, reikalingi sugalvoti/suorganizuoti, kaip tinkamai atlikti tyrimą.
  • Eksperimento/Tyrimo planas („dizainas“) (siaurąja prasme; t.p. vadinama eksperimento „dizainu“, angl. experimental design, study design) – tai terminas, apibūdinantis, kokius kintamuosius tiriame eksperimento metu ir kaip tiriamiesiems priskiriamos (angl. assign) tam tikros eksperimento sąlygos, t.y., kaip tiriamieji paskirstomi į eksperimento grupes (McLeod 2017), kad korektiškai galėtume įvertinti tai, ką norime ištirti. (Pavyzdžiai pateikti skyriuje „3.4.2 Eksperimentų imtys (grupės)“).


Kintamieji ir su jais susiję terminai:

  • Priklausomas (arba atsako) kintamasis (angl. dependent, response variable) – tas, kurio reikšmių kitimas stebimas kaip atsakas į nepriklausomo kintamojo reikšmių kitimą (pvz., pulsas, jei tiriame pulso priklausomybę nuo nubėgto atstumo) arba kurio reikšmių kitimas aiškinamas kito kintamojo (kitų kintamųjų) reikšmių kitimu (t.y., ryšys nebūtinai priežastinis). Grafike įprastai atidedamas Y ašyje.
  • Nepriklausomas (arba aiškinamasis) kintamasis (angl. independent, explanatory variable) – tas kintamasis, kurio reikšmes keičia tyrėjas ir/arba kurio reikšmių pokyčiu aiškinamas priklausomo kintamojo reikšmių pokytis (pvz., nubėgtas atstumas, jei tiriame pulso priklausomybę nuo nubėgto atstumo). Grafike įprastai atidedamas X ašyje.
  • Faktorius – aiškinamasis kintamasis, kuris yra kategorinis, diskretusis arba traktuojamas kaip toks.
  • Faktoriaus lygiai (tai labiau vertinys iš anglų kalbos, nei terminas; angl. factor levels) – pogrupiai. Tam tikros sąlygos, kuriomis vykdomas eksperimentas (pvz., fizinio aktyvumo pogrupiai: mažas, vidutinis, didelis).
  • Faktorinis eksperimento planas (angl. factorial experimental design) – tai toks planas, kai vienu metu tiriamas dviejų ar daugiau faktorių poveikis sistemai.
  • Šalutiniai kintamieji (angl. nuisance, lurking variables) – kintamieji, kurie tyrimo metu gali veikti priklausomo kintamojo reikšmes, bet jų įtaka nėra tiriama (neregistruojamos reikšmės).
  • Kintamųjų samplaika (angl. confounding) – šalutinių ir/ar nepriklausomų kintamųjų poveikių priklausomam kintamajam neatskiriamumas. Tai yra labai nepageidaujamas reiškinys, nes iškreipia rezultatus. Neįvertinus galimos samplaikos padaroma labai daug esminių klaidų interpretuojant rezultatus. Pavyzdžiai susiję su samplaika: klaidos nepagrįstai darant išvadas apie priežastinį ryšį (žr. skyriuose „2.2.3 Koreliacija neparodo priežastingumo“ ir „12.1.1 Sąsaja neparodo priežastingumo“).
  • Samplaikos kintamasis (angl. confounding variables) – tai šalutinis kintamasis, kuris taip pat daro poveikį priklausomam kintamajam ir šių (samplaikos ir nepriklausomų) kintamųjų poveikio negalima atskirti. Plačiau apie samplaikos kintamuosius rašo (McDonald 2014d). Taip pat žemiau pateiktas šį reiškinį iliustruojantis mokomasis filmukas.
  • Apgaulinga (netikra) koreliacija, sąsaja ar ryšys (angl. spurious correlation, association, relationship) – tai apgaulinga, netikra, dėl atsitiktinio sutapimo atsiradusi, priežastinio ryšio neturinti, bet matematiškai nustatyta sąsaja tarp kintamųjų. (T.y., sąsaja, kurios iš tiesų nėra). Įprastai atsiranda neturint pilnos informacijos apie tiriamą sistemą dėl samplaikos kintamųjų. (Šia tema iš dalies rašoma skyriuose „2.2.3 Koreliacija neparodo priežastingumo“ ir „12.1.1 Sąsaja neparodo priežastingumo“.)


Tyrimų grupės (poveikio darymas ir kontrolė):

  • Poveikis (angl. treatment arba exposure) – tai tam tikros sąlygos (pvz., procedūra, preparatas ar pan.), kurias patyrė kuri nors tiriamųjų grupė. Įprastai norima įvertinti, kokią įtaką šios sąlygos daro tiriamam procesui.
  • Placebas – bet kokios sąlygos (medžiaga, preparatas, procedūra ar pan.), kurios iš tiesų neturi jokios objektyvios įtakos tiriamam procesui.
  • Poveikio, tiriamoji arba eksperimentinė grupė (angl. treatment group arba exposure group) – tyrimo grupė, kuri patyrė poveikį.
  • Kontrolinė arba palyginamoji grupė (angl. control arba reference group) – tyrimo grupė, kuri nepatyrė poveikio ir kuri naudojama kaip atskaitos grupė palyginimui.
  • Placebo efektas – tai efektas, kurį turėtų sukelti poveikis, kai poveikis iš tiesų nebuvo taikomas. Pvz., tiriamojo sveikatos būklės pagerėjimas, kai tiriamasis iš tiesų negavo veikliosios medžiagos.
  • Dvigubai aklas eksperimentas (angl. double-blind experiment) – toks eksperimentas, kai nei tiriamasis, nei matavimus atliekantis tyrėjas nežino, kuriai grupei (kontrolinei ar poveikio) tiriamasis yra priskirtas bei kokį poveikį patyrė. Taip apsisaugoma nuo sistemingosios klaidos dėl tyrėjo ar tiriamojo elgesio.

Rekomenduojami video resursai:

  1. „Causation vs Association, and an Introduction to Experiments (3.1)“ ,
  2. „Placebo Effect, Control Groups, and the Double Blind Experiment (3.2)“ ,
  3. „Clearing Up Confounding“ .

3.2 Tyrimas ir eksperimentas

Pagal tai, ar daroma įtaka tiriamajai sistemai, tyrimus galima suskirstyti į stebėjimo tyrimus ir eksperimentus.

  • Stebėjimo tyrimai yra tokie tyrimai, kai duomenys yra renkami (nebūtinai žiūrėjimo – bet kokiu būdu) nedarant poveikio analizuojamai sistemai. Tokie eksperimentai gali padėti atskleisti ryšį tarp kelių veiksnių (kintamųjų), bet įprastai neleidžia daryti priežastinių išvadų (t.y., kas yra kieno priežastis).
  • Eksperimentai – tai tokie tyrimai, kai analizuojamai sistemai yra daromas tam tikras poveikis ir tiriamas jos atsakas. Paprasčiausiu atveju būna kontrolinė ir poveikio grupės. Jei eksperimentas suplanuotas tinkamai, pagal jo rezultatus galima daryti priežastines išvadas. Dėl galimybių stokos, tyrimo pobūdžio, etinių ar kitokių priežasčių ne visoms sistemoms galime daryti norimą poveikį.

Analogišką tyrimą galime susiplanuoti kaip stebėjimo tyrimą arba kaip eksperimentą. Sakykime, jei norime ištirti, kokią įtaką rytinis arbatos ir kavos gėrimas daro produktyvumui darbo dienos metu, mes galime susidaryti imtį ir joje nustatyti, kurie žmonės ryte vartoja kavą, kurie vartoja arbatą ir kurie vartoja tik vandenį. Įtakos tiriamai sistemai nedarome, nes tie žmonės, kuriuos tiriame, tiesiog taip elgiasi savaime, be mūsų nurodymo. Tai būtų stebėjimo tyrimas.

Arba mes galime susidaryti atsitiktinę imtį (atsitiktinė imtis – yra tokia imtis, į kurią visi tiriamieji buvo parinkti visiškai atsitiktinai; angl. random sampling), tada tiriamuosius atsitiktinai suskirstyti (angl. assign) į grupes: vienų prašyti savaitę ryte gerti tik vandenį, kitų – tik arbatą, trečių – tik kavą. Mes paskiriame, kaip turėtų elgtis konkrečios grupės nariai, todėl taip daromas poveikis tiriamiesiems, tad turime eksperimentą.

Tad koks esminis skirtumas tarp šių tyrimo planų? Pirmuoju atveju galėtume nustatyti tik sąsają tarp rytinio gėrimo ir produktyvumo, bet ne priežastinį ryšį (tad teiginiai „kas produktyvesni, tie vartoja tam tikrą gėrimą“ ir „kas vartoja tam tikrą gėrimą, tie yra produktyvesni“ yra lygiaverčiai). Šituo atveju gali būti ir tretieji (samplaikos) veiksniai, kurie stebėjimo tyrimų metu nėra kontroliuojami. Antruoju – galime teigti, kad tam tikras gėrimas yra susijęs su produktyvumo padidėjimu ar sumažėjimu. Atsitiktinai suskirstydami į grupes, eliminuojame arba sumažiname šalutinių veiksnių poveikį.

3.3 Klaidos, paklaidos ir tikslumas

3.3.1 Tikrumas ir glaudumas

Sąvoką „tikslumas“ galima suskaidyti į dvi komponentes. Jos abi įprastai vadinamos „tikslumu“, tad vengdami maišaties šiame skyriuje jas pavadinsime skirtingais žodžiais: „tikrumu“ ir „glaudumu“. Jų esmė atvaizduota pav. 3.1, 3.2 ir 3.3.

Tikrumas (angl. accuracy) – parodo, kaip arti tikrosios vertės yra mūsų rezultatai (ar kelių bandymų vidurkis). Glaudumas (angl. precision) – parodo, kaip arti vienas kito yra kelių pakartojimų rezultatai. Jei kitos sąlygos nekinta, tai mažesnis glaudumas rodo didesnę variaciją (angl. variation) ir didesnę neapibrėžtį (angl. uncertainty). Ir atvirkščiai: didesnis glaudumas – mažesnę variaciją ir mažesnę neapibrėžtį.

Pastaba dėl angliškų terminų: variation yra variacija – kintamojo reikšmių įvairovė, o variance yra dispersija – standartinis nuokrypis kvadratu.

Tikslumas: tikrumas ir glaudumas atvaizduoti kaip šūviai į taikinį.
Šaltinis: [http://www.antarcticglaciers.org](http://cdn.antarcticglaciers.org/wp-content/uploads/2013/11/precision_accuracy-768x513.png){target="_blank"}.

Pav. 3.1: Tikslumas: tikrumas ir glaudumas atvaizduoti kaip šūviai į taikinį. Šaltinis: http://www.antarcticglaciers.org.

Tikslumas: tikrumas ir glaudumas atvaizduoti kaip šūviai į taikinį bei skirstiniai.
Šaltinis: [@Peternelli2015].

Pav. 3.2: Tikslumas: tikrumas ir glaudumas atvaizduoti kaip šūviai į taikinį bei skirstiniai. Šaltinis: (Peternelli ir Resende 2015).

Tikslumas: tikrumas ir glaudumas atvaizduoti kaip rezultatus apibendrinančio skirstinio savybės. 
Šaltinis: [simple.wikipedia.org](https://simple.wikipedia.org/wiki/Accuracy_and_precision){target="_blank"}.

Pav. 3.3: Tikslumas: tikrumas ir glaudumas atvaizduoti kaip rezultatus apibendrinančio skirstinio savybės. Šaltinis: simple.wikipedia.org.

3.3.2 Sistemingosios ir atsitiktinės (pa)klaidos

Atvirkštinis dalykas tikslumui yra (pa)klaidos ir neapibrėžtumas (neapibrėžtis). Tyrimo rezultatai iš principo visada bent šiek tiek nesutampa su tikrosiomis reikšmėmis (kurių įprastai nežinome: jei žinotume, matyt, tyrimo apskritai nevykdytume). Taip yra dėl klaidų ir paklaidų. Terminas „paklaida“ labiau tinkamas, kai kalbame apie atsitiktinius procesus, „klaida“ – kai apie neatsitiktinius (nors kai kuriuose šaltiniuose jie vartojami kaip sinonimai). Apsibrėžkime, kad imties (pa)klaida – tai skirtumas tarp tikrosios (t.y., iš generalinės aibės apskaičiuotos) reikšmės ir reikšmės, apskaičiuotos iš imties duomenų, o matavimų (pa)klaida – tai skirtumas tarp tikrosios ir prietaisu ar įrankiu gautos reikšmės.


Sistemingoji (sisteminė) klaida (angl. systematic error arba bias) – tai sisteminis tyrimo rezultatų nuokrypis nuo tikrosios vertės . Pvz., kai rezultatai nuo tikrosios vertės yra nukrypę per tą pačią konstantą ar tą patį daugiklį. Jei tyrimas būtų kartojamas vienodomis sąlygomis, tai kiekvieno pakartojimo metu sistemingoji klaida būtų tokio paties dydžio, t.y., atkartojama. Dėl šios priežasties kai kuriais atvejais šią klaidą galima panaikinti ar sumažinti duomenų paruošimo analizei metu.

Sistemingosios klaidos kyla dėl netinkamai suplanuoto ar įvykdyto tyrimo, dėl prastai parengtų, nesukalibruotų, išderintų ar prastai veikiančių prietaisų, netinkamo imties sudarymo būdo (pvz., jei imtis yra netikimybinė).

Sistemingosios klaidos mažina tikrumą (tikslumo dedamąją, kurią apibūdinome ankstesniame poskyryje).


Atsitiktinė paklaida (angl. random error) – tai atsitiktinis tyrimo rezultatų nuokrypis nuo tikrosios reikšmės. Jei tyrimas būtų kartojamas vienodomis sąlygomis, tai kiekvieno pakartojimo metu vis tiek būtų gaunamas vis šiek tiek skirtingas rezultatas.

Atsitiktinė paklaida atsiranda dėl natūralios variacijos (požymio reikšmių įvairovės) ir atsitiktinumo parenkant tiriamuosius (nes imtis visada mažesnė už GA ir kaskart sudaroma vis kitokia atsitiktinė imtis) ir dėl įvairių kitų atsitiktinių dalykų.

Atsitiktinės paklaidos didėjimas mažina glaudumą (tikslumo dedamąją), tad didina neapibrėžtį ir mažina patikimumą.


Sąsajos tarp imties dydžio ir tikslumo tendencijos iliustracija tikimybinėms imtims.
Norint gauti santykinai didelį tikslumą, nėra būtina ištirti visą GA. 
Parengta pagal [@Stamatopoulos2002, sk. 4.3].

Pav. 3.4: Sąsajos tarp imties dydžio ir tikslumo tendencijos iliustracija tikimybinėms imtims. Norint gauti santykinai didelį tikslumą, nėra būtina ištirti visą GA. Parengta pagal (Stamatopoulos 2002, sk.4.3).

Įvairių rodiklių, skaičiuojamų iš imties duomenų (pvz., vidurkis) atsitiktinė paklaida priklauso nuo imties dydžio: kuo didesnė imtis, tuo paklaida mažesnė. Tačiau paklaidos didumo kitimas didėjant imčiai nėra tolygus: pradžioje paklaida mažėja labai sparčiai, bet vėliau – tik neženkliai (pav. 3.4). Tad norint gauti pakankamą tikslumą, nebūtina ištirti visos GA. Visgi reiktų žinoti, kad imtis turėtų būti pakankamai didelė, nes kitaip išauga nereprezentatyvumo galimybė (pav. 3.5).


Mažoms net ir tikimybinėms imtims yra didelė nereprezentatyvumo rizika.
Per maža imtis negali būti reprezentatyvi.

Pav. 3.5: Mažoms net ir tikimybinėms imtims yra didelė nereprezentatyvumo rizika. Per maža imtis negali būti reprezentatyvi.

Pradiniam biologiniam tyrimui rekomenduojama surinkti bent 30-100 tiriamųjų imtį.

Pradiniam (bandomajam) tyrimui rekomenduojama skirti tik mažą dalį (pvz., ne daugiau kaip 25%) turimų resursų ir pasižiūrėti „ar viskas gaunasi“ kaip suplanuota.

Apie atsitiktinę ir sistemingąją imties (pa)klaidas rašoma (Čekanavičius ir Murauskas 2006, p.14–15, sk. 2.3). Rekomenduojami video resursai: „Random or Systematic Error 002“ , „Sampling error in statistics and data science“ .

3.4 Imčių sudarymo būdai

Imties sudarymas (angl. sampling) – tai procedūra, kurios metu pasirenkami ir į tyrimą įtraukiami konkretūs tiriamieji (elementai). Svarbiausias reikalavimas, kad sudarius imtį ji būtų reprezentatyvi. Iš praktinės pusės taip pat svarbu, kiek ir kokių resursų prireiks sudarant imtį: kaina, laikas, techninės galimybės, paprastumas ir kita. Taip pat turimų žinių apie GA kiekis, tyrimo pobūdis, norimų daryti išvadų gilumas ir svarba (pvz., preliminarus bandomasis tyrimas ar medicininis gyvybės ir mirties klausimas) bei kiti dalykai. Todėl yra ne vienas galimas imties sudarymo būdas.

3.4.1 Vienos imties sudarymo būdai

Reikia žinoti, kad sudarant imtis visada egzistuoja atsitiktinumas (pvz., iš anksto neaišku, kurie GA elementai/tiriamieji pateks į imtį; jei sudarymo procedūra kartotume kelis kartus, tai į naują imtį patektų ne būtinai tie patys objektai). Pagal jo tipą imtys būna:

  • netikimybinės, jei atsitiktinumas yra subjektyvus ir jo įtakos imties sudarymui neįmanoma įvertinti. Problema su netikimybinėmis imtimis ta, kad pagal jas negalima daryti išvadų apie visą GA, nes imtys yra nereprezentatyvios (t.y., negalima patikimai įvertinti paklaidų). Visgi tam tikrais atvejais tokios imtys naudojamos, jei geresnio varianto neleidžia per dideli kaštai ar galimybės.
  • tikimybinės, jei atsitiktinumas yra griežtai ir objektyviai apibrėžtas, nes imtis yra sudaryta naudojantis tikimybių teorijos principais. Jei tikimybinio imties sudarymo būdas yra parinktas tinkamai ir imtys yra pakankamo dydžio, tokios imtys, tikėtina, yra reprezentatyvios. Aišku, yra galimybė, kad ir tikimybinė imtis bus nereprezentatyvi dėl jau minėtojo atsitiktinumo. Visgi, laikoma, kad šio tipo imtys yra tinkamos daryti pagrįstas išvadas apie visą GA.
Atsitiktinis ėmimas ≠ „Aklas ėmimas“

Sakydami „visiškai atsitiktinis imties sudarymas“ įprastai turime omenyje „tikimybinis“ (nes visiems objektams yra vienoda galimybė patekti į imtį, t.y., aiškiai apibrėžta tikimybė patekti į imtį). Bet „aklas“ ėmimas (pvz., paimti užsimerkus) iš tikrųjų gali būti nevisiškai atsitiktinis. Pvz., jei objektai skirtingo dydžio, tai imant „aklai“, daugiausia šansų paimti didelius. Jei imami pirmi pasitaikę – galbūt pirmi traukia suaugę paukščiai, po to – jaunikliai, arba galbūt patinai ir patelės migruoja skirtingais maršrutais ir sutiksime tik vienus iš jų. Tad toks nesuplanuotas („aklas“) imties sudarymas negarantuoja reprezentatyvumo. Taip pat reikia prisiminti, kad žmonės yra prasti atsitiktinių skaičių „generatoriai“: jie tik galvoja, kad atliko ar parinko „atsitiktinai“, bet dažniausiai taip nėra.


Pastaba dėl angliškų terminų: sample yra „imtis“, sampling – „imties sudarymas“.


Netikimybinės imtys (angl. non-probability, biased sampling)

  • Proginė (ang. convenience sampling) – kai į imtį įtraukiami pirmi pasitaikę elementai. Sudarant šias imtis didžiausia problema ta, kad labai daug atsitiktinumo, kurio negalima aprašyti matematiniais modeliais, tad imtis yra nereprezentatyvi. Taikant šį būdą ir darant išvadas apie visą GA padaroma daugiausiai klaidų.
  • Ekspertinė (ang. expert sampling) – kai imtis sudaroma pagal eksperto nuomonę (ekspertas išrenka ar nurodo, kurie objektai bus ištirti). Skirtingi ekspertai gali turėti skirtingas nuomones ir sudaryti visiškai skirtingas imtis. Ekspertų nuomonės daugiau ar mažiau yra subjektyvios. Tad tokios imtys yra nereprezentatyvios.
  • Kvotinė (angl. quota sampling) – pagal GA savybes nustatomos tam tikros kvotos, kiek tam tikros grupės elementų reiktų ištirti (pvz., kiek vyrų, kiek moterų), tačiau iš kiekvieno pogrupio imama ne visai atsitiktinai. Skirtumas nuo sluoksninės imties tas, kad naudojant sluoksninį sudarymo būdą GA nariai iš kiekvieno sluoksnio į imtį patenka visiškai atsitiktinai, o taikant kvotinį – nebūtinai atsitiktinai.


Schemiškai iliustruojami tikimybiniai imties sudarymo būdai: paprastasis atsitiktinis (kairėje viršuje), sistemingasis (periodinis; kairėje apačioje), lizdinis (dešinėje viršuje) ir sluoksninis (dešinėje apačioje). 
Geltonai vaizduojami į imtį patekę elementai.

Pav. 3.6: Schemiškai iliustruojami tikimybiniai imties sudarymo būdai: paprastasis atsitiktinis (kairėje viršuje), sistemingasis (periodinis; kairėje apačioje), lizdinis (dešinėje viršuje) ir sluoksninis (dešinėje apačioje). Geltonai vaizduojami į imtį patekę elementai.

Tikimybinės imtys (angl. unbiased, probability sampling):

  • paprastoji atsitiktinė grąžintinė imtis (angl. simple random sampling with replacement) – kai visiems GA elementams patekti į imtį yra vienodos galimybės. Naudojami visi GA elementai. Naudojami metodai, užtikrinantys visišką atsitiktinumą (atsitiktinių skaičių generatoriai, lentelės ar pan.) Ištyrus vieną elementą, jis grąžinamas atgal ir turi galimybę patekti į imtį pakartotinai (taip užtikrinama, kad visiems elementams galimybės nesiskirtų). Teoriškai, tai pats idealiausias imties sudarymo būdas.
  • paprastoji atsitiktinė negrąžintinė imtis (angl. simple random sampling without replacement) – sudaroma analogiškai, kaip prieš tai minėtoji, bet elementai atgal negrąžinami. Tai reiškia, kad imant antrą elementą, GA nariams yra didesnė tikimybė patekti į imtį nei imant pirmą, imant trečią – didesnė nei imant antrą ir t.t., nes generalinėje aibėje narių skaičius mažėja (kuo mažiau narių, tuo vienam iš jų yra didesnė galimybė būti išrinktam). Jei GA yra labai didelė (pvz., begalinė), tai ištirto elemento negrąžinimas praktiškai tik labai mažai paveikia vieno objekto patekimo į imtį galimybę. Tačiau mažoms GA – labai smarkiai.
  • sistemingoji (periodinė) imtis (angl. systematic sampling) – pasirenkamas išsirinkimo žingsnis (kas kelintas elementas pateks į imtį), visi elementai išrikiuojami į eilę, atsitiktinai pasirenkamas pirmasis, o tada pasirinktu žingsniu išsirenkami visi likusieji. Metodas tinka, jei GA elementai yra išsidėstę neperiodiškai arba pasirinktas žingsnis nėra proporcingas savybės reikšmių išsidėstymo periodiškumui.
  • lizdinė imtis (angl. cluster random sampling) – visa GA pagal tam tikrą požymį suskirstoma į panašias grupes, vadinamas lizdais arba klasteriais. Paprastojo atsitiktinio imties sudarymo būdu pasirenkamas tam tikras skaičius lizdų. Kiekviename lizde ištiriami visi tiriamieji. Šis sudarymo būdas tinka, jei GA lizdų atžvilgiu yra vienalytė (lizdai tarpusavyje pakankamai panašūs), o lizdų viduje – nevienalytė (lizdų viduje elementai yra pakankamai skirtingi).
  • sluoksninė imtis (angl. stratified random sampling) – visa GA suskirstoma į sluoksnius, dar vadinamus stratais. Iš kiekvieno sluoksnio paprastuoju atsitiktiniu būdu paimami elementai. Nuo kvotinės imties skiriasi tuo, kad sluoksninei imčiai iš kiekvieno sluoksnio imama atsitiktinai, o kvotinei – ne. Šis sudarymo būdas tinka, jei turima informacijos apie GA struktūrą, GA yra nevienalytė sluoksnių atžvilgiu ir vienalytė sluoksnio viduje.
  • daugiapakopės imtys (angl. multistage sampling) – kai sudarant imtį derinami keli anksčiau išvardintų tikimybinių imčių sudarymo metodai.

Pavyzdys 1. Sakykime, mums reikia ištirti medžio lapus. Tad kaip atrodytų skirtingais būdais sudaromos imtys? Viršutiniu indeksu ¹ žymėsime netikimybines, o ² – tikimybines imtis.

  • Proginė¹ – jei ištiriame pirmus pasitaikiusius lapus, pvz., arčiausiai mūsų esančius, kuriuos pasiekiame be kopėčių.
  • Ekspertinė¹ – kai ištiriame tik tuos lapus, kuriuos nurodė tirti kolega, kuris remiasi savo (ekspertine) nuomone.
  • Kvotinė¹ – sakykime, norime, kad imtyje tolygiai atsispindėtų ant viršutiniame, viduriniame ir apatiniame kamieno trečdalyje esančių šakų išaugusių lapų duomenys. Tad medžio kamieną nuo tos vietos, kur ima augti šakos, suskirstome į trečdalius. Iš kiekvieno trečdalio imame pirmus pasitaikiusius lapus (t.y., ne atsitiktinai).
  • Paprastoji atsitiktinė grąžintinė² – visiems medžių lapams suteikiame eilės numerius, kompiuterio atsitiktinių skaičių generatorius atsitiktinai parenka lapų numerius. Ištiriame tik nurodytus lapus. Tas pats lapas į imtį gali patekti kelis kartus, nes sudarymas yra grąžintinis.
  • Paprastoji atsitiktinė negrąžintinė² – analogiškai, kaip ankstesnio punkto pavyzdyje, tik vienas lapas į imtį gali patekti tik vieną kartą.
  • Sistemingoji (periodinė)² – vėl visiems lapams suteikiami eilės numeriai, pradedame nuo 26 ir ištiriame kas 100-ąjį lapą. Jei nedviprasmiškai galime matyti, kokia eile yra išsidėstę lapai, tai eilės numeriai gali būti nebūtini, tiesiog pradedame nuo 26 ir imame kas 100-ąjį lapą.
  • Lizdinė imtis² – sunumeruojame visas medžių šakas, kompiuteris atsitiktinai parenka 10-ties šakų eilės numerius. Ištiriame visus lapus nuo nurodytų šakų.
  • Sluoksninė imtis² (keli variantai):
    1. kaip ir kvotinės imties pavyzdyje, šakas suskirstome pagal tai, kuriam kamieno trečdaliui šaka priklauso (tai ir yra „sluoksniai“). Kiekvieno trečdalio lapus sunumeruojame. Kompiuteris atsitiktinai parenka ir nurodo, kuriuos kiekvieno trečdalio lapus ištiriame (t.y., iš kiekvieno sluoksnio imtis sudaroma atsitiktinai);
    2. Nustatome, kurios šakos auga iš kamieno. Sakykime, norime, kad nuo kiekvienos tokios „stambiosios“ šakos būtų ištirta po vienodą lapų skaičių. Vėl sunumeruojame kiekvienos šakos lapus, kompiuteris atsitiktinai parenka, kuriuos lapus turime ištirti (čia viena šaka laikoma vienu sluoksniu).
  • Daugiapakopė² (keli variantai):
    1. iš kiekvieno kamieno trečdalio pasirenkame ištirti po vienodą skaičių šakų ir kompiuteris mums parenka, kurias šakas tirsime (sluoksninis atrinkimas). Tada iš kiekvienoje iš išrinktų šakų ištiriame kas 50 lapą pradėdami nuo dešimto (sisteminis atrinkimas).
    2. pasirenkame tirti kas 7 šaką nuo antros (sisteminis atrinkimas). Šakas suskirstome pagal storį į storas, vidutinio storumo ir plonas ir pasirenkame vienodą skaičių šakų iš kiekvienos grupės, kompiuteris atsitiktinai parenka, kurias konkrečiai šakas tirsime (sluoksninis atrinkimas). Sunumeruojame visus lapus ir kompiuteris parenka po 10 lapų iš atrinktų šakų (atsitiktinis grąžintinis imties sudarymas).

Pavyzdys 2. Sakykime, tiriame Vilniaus universiteto (VU) studentų nuotaikų pasiskirstymą.

  • Proginė¹ – ištiriame 100 savanorių.
  • Ekspertinė¹ – gydytojas psichiatras parenka, kuriuos studentus tirti.
  • Kvotinė¹ – iš kiekvieno fakulteto ištiriame po 20 savanorių.
  • Paprastoji atsitiktinė grąžintinė² – iš universiteto studentų sąrašo kompiuteris atsitiktinai parenka 200 studentų (tas pats studentas gali patekti kelis kartus). Ištiriami visi atrinkti studentai.
  • Paprastoji atsitiktinė negrąžintinė² – iš universiteto studentų sąrašo kompiuteris atsitiktinai parenka 200 studentų (tas pats studentas gali patekti tik vieną kartą). Ištiriami visi atrinkti studentai.
  • Sistemingoji (periodinė)² – iš studentų sąrašo parenkamas kas 120-tasis studentas pradedant nuo 13-to. Ištiriami visi atrinkti studentai.
  • Lizdinė imtis²:
    1. iš studentų sąrašo atsitiktinai parenkama 10 specialybių. Ištiriami visi atrinktų specialybių studentai.
    2. atsitiktinai parenkami 3 fakultetai ir ištiriami visi tų fakultetų studentai.
    3. atsitiktinai parenkamos 20 studentų grupių ir ištiriamas kiekvienas atrinktos grupės studentas.
    • Ištiriami visi atrinkti studentai.
  • Sluoksninė imtis² – iš studentų sąrašo (kiekvieno „sluoksnio“ atskirai) kompiuteris atsitiktiniu grąžintiniu būdu parenka (keli variantai):
    1. po 50 vyrų ir moterų.
    2. po 40 bakalauro, magistrantūros ir doktorantūros studentų.
    3. iš kiekvieno fakulteto parenka tokį tiriamųjų skaičių, kuris proporcingas visam to fakulteto studentų skaičiui.
    • Ištiriami visi atrinkti studentai.
  • Daugiapakopė² (keli variantai):
    1. studentai suskirstomi pagal pakopą ir metus, pvz., IV kurso bakalaurantas, II kurso magistrantas, I kurso doktorantas („sluoksniai“). Iš kiekvienos pakopos ir metų parenkama po 5 specialybes („lizdai“). Iš kiekvienos atrinktos specialybės atsitiktinai pasirenkama ir ištiriama po vienodą skaičių vyrų ir moterų („sluoksniai“). Ištiriami visi atrinkti studentai.


Šiame kurse dėstomi statistinių išvadų darymo metodai sukurti tik visiškai atsitiktinėms imtims ir tinka tik tada, jei imtis yra tikimybinė.


Kodėl reikia skirtingų imčių sudarymo būdų? Žiūrint iš tikimybių teorijos pusės, tinkamiausia yra laikoma paprastoji atsitiktinė grąžintinė imtis. Tačiau žiūrint iš praktinės pusės (sprendžiamo klausimo, tyrimo srities, imties sudarymo paprastumo, turimų finansinių, laiko, žmogiškųjų išteklių ir kitokių resursų), tyrimo stadijos (pirminis žvalgomasis „pilotinis“ ar vėlesnės stadijos tyrimas), gali būti pasirenkamas kitas labiau tyrimo poreikius ir galimybes atitinkantis imties sudarymo būdas.

Plačiau su pavyzdžiais tema apie vienos imties sudarymo būdus dėstoma (Čekanavičius ir Murauskas 2006, p.12–15). Rekomenduojami video resursai: „Types of Sampling Methods (4.1)“ , „Sampling: Simple Random, Convenience, systematic, cluster, stratified - Statistics Help“ .

3.4.2 Eksperimentų imtys (grupės)

Įprastai atliekant eksperimentą norima palyginti kelias grupes/imtis (priklausomai nuo konteksto, kartais patogiau vartoti terminą „grupės“, kartais – „imtys“). Aptarsime du paprasčiausius kelių imčių derinimo būdus:

  1. Nepriklausomos (angl. independent, between-subject design) – lygiagrečios – imtys. Tai kelios imtys, kurių elementai nei tarp imčių, nei imčių viduje yra nesusiję. Pavyzdys, kai naudojamos kontrolinė ir tiriamoji grupės, į kurias atrenkami skirtingi tiriamieji. T.y., tas pats tiriamasis priklauso tik vienai iš grupių. Sakykime, vienos grupės tiriamieji gauna preparatą su veikliąja medžiaga, kitos – placebą (preparatą be veikliosios medžiagos). Tad grupių dydžiai gali būti skirtingi. Jei grupių dydžiai yra vienodi, tyrimas vadinamas subalansuotuoju.

    Šio imčių derinimo metodo pliusas yra tas, kad jei tiriamasis neatvyktų, tai nebūtų toks didelis praradimas, kaip priklausomų imčių atveju. Minusas – reikia daugiau tiriamųjų, dėl to gali išaugti tyrimo kaštai.

  2. Priklausomos (angl. dependent, within-subject design) – porinės (angl. paired) arba kartotinės (angl. repeated measures) – imtys yra tokios, kai elementas vienoje imtyje turi atitikmenį ir visose kitose. Dėl šios priežasties visų grupių dydžiai yra vienodi. Visgi elementai tos pačios imties (grupės) viduje yra nesusiję, nepriklausomi. Įprastas pavyzdys, kai tas pats tiriamasis tiriamas skirtingomis sąlygomis, priklauso ir kontrolės, ir poveikio grupėms. Sakykime, viename tyrimo etape tas pats tiriamasis gauna preparatą su veikliąja medžiaga, kitame – be jos. Registruojamas to paties tiriamojo atsakas skirtingomis sąlygomis.

    Šio imčių derinimo būdo pliusas yra toks, kad reikia mažiau tiriamųjų. Bet jei tiriamasis neatvyks bent į vieną eksperimentą (nebus ištirtas tam tikromis sąlygomis), visa apie tą tiriamąjį iki tol surinkta informacija gali tapti bevertė.

  3. Mišrusis derinimo būdas (angl. mixed design) tai abiejų anksčiau išvardintų būdų naudojimas, kai pagal vienas sąlygas buvo tirti skirtingi tiriamieji, pagal kitas – tie patys. (Šio kurso metu apie mišrųjį būdą plačiau nesimokysime).

Kelių imčių derinimo būdai: priklausomos ir nepriklausomos imtys.
Ilgasis formatas -- kai naujų grupių duomenys rašomi į naujas eilutes (lentelė pailginama).
Platusis formatas -- kai naujų grupių duomenys pateikiami naujuose stulpeliuose (lentelė paplatinama). 
Paveiksle iliustruojamas tik lentelių sudarymo principas, o ne pilnos lentelės.

Pav. 3.7: Kelių imčių derinimo būdai: priklausomos ir nepriklausomos imtys. Ilgasis formatas – kai naujų grupių duomenys rašomi į naujas eilutes (lentelė pailginama). Platusis formatas – kai naujų grupių duomenys pateikiami naujuose stulpeliuose (lentelė paplatinama). Paveiksle iliustruojamas tik lentelių sudarymo principas, o ne pilnos lentelės.

Eksperimentų imčių derinimo būdai aprašyti (Čekanavičius ir Murauskas 2006, p.15–16). Taip pat rekomenduoju peržiūrėti video resursus: „Independent Dependent & Mixed Designs“ .

3.5 Eksperimentų planavimo principai

Šiame poskyryje aptarsime kelis svarbius principus, kuriuos reiktų taikyti vykdant eksperimentus:

  1. Kontrolė. Tiksliausias išvadas galima padaryti tada, kai tyrimas vykdomas kontroliuojamomis sąlygomis. Kai galima, geriausia kintamųjų reikšmes kontroliuoti. Pvz., tyrimo metu reikia naudoti kontrolinę (lyginamąją) grupę tam, kad būtų galima įvertinti poveikio įtaką rezultatams.
  2. Pakartojimai (replikacijos) – nepakanka, kad vienomis tyrimo sąlygomis būtų ištirtas tik vienas tiriamasis. Pvz., tiriant vaisto poveikį neužtenka 2 tiriamųjų: vieno, kuris gavo vaistą, ir vieno, kuris jo negavo. Reikia atlikti pakartojimus su pakankamu kiekiu tiriamųjų ir kiekvienomis iš eksperimento sąlygų surinkti pakankamai didelę imtį. Taip padidinsime rezultatų patikimumą ir tiksliau įvertinsime neapibrėžtumą ir atsitiktinę paklaidą. Taip pat pakankamai didelių imčių reikia tam, kad vykdant analogišką tyrimą būtų gaunami analogiški (atkartojami) rezultatai.
  3. Randomizacija. Galima teigti, kad randomizacija yra atsitiktinės eilės tvarkos sudarymas ar atsitiktinis suskirstymas į grupes. Jau buvo minėta, kad geriausia, kai tyrimo sąlygos yra kontroliuojamos. Tačiau kartais tai brangu užtikrinti ar net neįgyvendinama. Tokiu atveju, visas sąlygas, kurių negalima kontroliuoti, reiktų randomizuoti. Pvz., kiekvienas tiriamasis turi turėti vienodą galimybę patekti į bet kurią iš tyrimo grupių. Tad tiriamųjų suskirstymas į kontrolines ir poveikio grupes privalo būti visiškai atsitiktinis. Tai padeda išvengti sisteminės klaidos bei sudaro prielaidas daryti labiau pagrįstas išvadas apie priežastinį ryšį, nes sumažina šalutinių kintamųjų įtaką.
  4. Blokavimas (stratifikavimas, sluoksniavimas). Kartais prieš tyrimą mes turime papildomos informacijos apie tiriamuosius, kurią galime panaudoti, kad poveikio ir kontrolinė grupė pagal savo struktūrą būtų kuo panašesnės. Tad blokavimas – tai, prieš priskyrimą kontrolinei ir poveikio grupėms, tiriamųjų suskirstymas į blokus – pagal tam tikrą požymį panašias grupes. Blokavimas skirtas sumažinti potencialų samplaikos kintamųjų poveikį. Jo esmė tokia:
    • tiriamieji sugrupuojami į blokus pagal šalutinių kintamųjų reikšmes.
    • kiekvieno bloko nariai atsitiktinai, bet proporcingai paskirstomi į kontrolines ir poveikio grupes. Kadangi kontroles ir poveikio grupėse yra po (daugmaž) vienodą skaičių tam tikro bloko narių, taip sumažinama šalutinio kintamojo įtaka ir sisteminės klaidos tikimybė. (Vaizdi šio principo iliustracija pateikta įraše „Principles of experimental design“, nuorodą rasite žemiau).

Norint sumažinti šalutinių kintamųjų įtaką, galimi tokie scenarijai:

  1. jei galite, norite ir tai yra korektiška, fiksuokite šalutinio kintamojo reikšmę, pvz., naudokite tik 4 savaičių pateles.
  2. jei negalite fiksuoti, tada atlikite blokavimą, pvz., naudokite ir 4, ir 6 savaičių pateles.
  3. jei negalite nei fiksuoti, nei blokuoti, tada randomizuokite (į grupes suskirstykite visiškai atsitiktinai).

Rekomenduojami video resursai:

  1. „Types of Experimental Designs (3.3)“

3.6 Išvadų tipas pagal tyrimo planą

Panagrinėkime du aspektus – imties sudarymą (ar visiškai atsitiktinis, t.y., tikimybinis, ar ne) ir tiriamųjų paskirstymo į kontrolės bei poveikio grupes pobūdį (ar atsitiktinis, ar ne):

Tikimybinis imties sudarymasRezultatus galima generalizuoti visai GA.
Netikimybinis imties sudarymasRezultatų generalizuoti negalima.
Atsitiktinis paskirstymas į grupes (randomizuota)Galima daryti išvadas apie priežastinį ryšį.
Paskirstymas nėra atsitiktinis (nerandomizuota)Išvadų apie priežastinį ryšį daryti negalima.

Informacijos šaltiniai

Čekanavičius V., Murauskas G. Statistika ir jos taikymai I. Vilnius: TEV (2006).
McDonald J.H. Confounding variables. Handbook of Biological Statistics. Baltimore, Maryland: Sparky House Publishing. (2014d). Prieiga per internetą: http://www.biostathandbook.com/confounding.html.
McLeod S. Experimental Design (2017). Prieiga per internetą: https://www.simplypsychology.org/experimental-designs.html.
Peternelli L.A., Resende M.D.V. de Experimental Designs for Next Generation Phenotyping. Phenomics. Cham: Springer International Publishing. (2015). DOI: 10.1007/978-3-319-13677-6_2.
Stamatopoulos C. General Sampling Considerations. Sample-based fishery surveys: A technical handbook. Rome: Food; Agriculture Organization of the United Nations. (2002). Prieiga per internetą: https://www.fao.org/3/y2790e/y2790e05.htm#bm05.