4  Skaitiniai metodai kintamųjų porai

Šio skyriaus medžiaga vis dar rengiama.
Turinys bus papildytas.


4.1 Porinės dažnių lentelės

Pagal dviejų kintamųjų reikšmes sudarytas dažnių lentelės galima pateikti keliomis formomis:

Pav. 4.1. Duomenų lentelės pavidalo dažnių lentelės sudarymas (principo iliustracija). Duomenys (kairėje) turi 2 savybes (lytį ir spalvą), pagal kurių reikšmes ir sudaroma dažnių lentelė (dešinėje).
  1. Duomenų lentelės pavidalo dažnių lentelė – tai tokia pateikimo forma, kai keliuose stulpeliuose surašomos galimos skirtingos kintamųjų reikšmių kombinacijos, o paskutiniajame – dažnis (pvz., pav. 4.1, lentelė 4.1).
    • Tokias lenteles labiau įprasta vadinti „dviejų kintamųjų dažnių lentelėmis“ ar tiesiog „dažnių lentelėmis“ (angl. frequency table).
    • Jei norima pateikti ne tik absoliutųjį, bet ir santykinį dažnį, tam gali būti skirtas dar vienas ar net keli atskiri stulpeliai.
    • Pliusai:
      • Lengva pridėti papildomus stulpelius su reikiama informacija (pvz., santykiniais dažniais);
      • Reikšmes (eilutes) galima išrikiuoti pagal pasitaikymo dažnumą ir taip pamatyti dažniausiai ar rečiausiai pasitaikančias;
      • Įprastai jei yra trūkstamų reikšmių, jos rodomos automatiškai.
    • Minusai:
      • Kartais nuliniai dažniai automatiškai nerodomi;
      • Dėl ankstesnio punkto kartais galima nematyti neegzistuojančių/nepasitaikiusių kombinacijų.
      • Jei skaičiuojami sąlyginiai santykiniai dažniai atskiriems pogrupiams (pvz., akių spalvų pasitaikymo procentinė dalis atskirai vyrams, atskirai moterims), šios formos lentelėse kartais sunkiau pamatyti dėsningumus.
Pav. 4.2. Matricos pavidalo (porinės) dažnių lentelės sudarymas (principo iliustracija). Duomenys (kairėje) turi 2 savybes (lytį ir spalvą), pagal kurių reikšmes ir sudaroma porinė (šiuo atveju 2×2) dažnių lentelė (dešinėje).
  1. Matricos pavidalo dažnių lentelė – tai tokia forma, kai galimos skirtingos vieno kintamojo reikšmės surašomos kaip lentelės eilučių, o kito kintamojo – kaip stulpelių pavadinimai. Langeliuose surašomi atitinkamų reikšmių kombinacijų dažniai (pvz., pav. 4.2, lentelė 4.2).
    • Tokio pavidalo lenteles įprasta vadinti porinėmis dažnių lentelėmis1 (angl. cross-tabulation, contingency table, arba two-way table).
    • Išplėstinės jų formos gali turėti eilučių ir stulpelių sumas, o vietoje ar šalia absoliučiųjų dažnių gali būti santykiniai, standartizuoti arba pagal bendrą imties dydį, arba pagal eilučių ar stulpelių sumas. Pvz., lentelėje 4.4 pateikti visų 4 rūšių dažniai bei eilučių ir stulpelių sumos.
    • Kiekvieno kintamojo galimų reikšmių skaičius apibrėžia lentelės dydį. Jei yra po 2 galimas reikšmes, tai turime 2×2 dydžio lentelę, jei vienas kintamasis turi 3, o kitas 5 galimas reikšmes, tai – 3×5 lentelė.
    • Pliusai:
      • Dėl išdėstymo struktūros automatiškai matosi, kuriose vietose yra nuliniai dažniai;
      • Dėl išdėstymo lengviau pastebėti dėsningumus, kai skaičiuojami sąlyginiai santykiniai dažniai pogrupiams (pvz., 4.3).
      • Aiškiau matosi, kurie (eilučių ar stulpelių) dažniai susideda į 100%.
      • Galima pridėti suminius eilučių ir/arba stulpelių dažnius.
    • Minusai:
      • Dažnai programos automatiškai nerodo, jei yra trūkstamų reikšmių. Jų rodymą gali reikti įjungti išreikštai keičiant parametrus.
Pav. 4.3. Skirtingo tipo santykiniai dažniai porinėse dažnių lentelėse (principo iliustracija).

Iliustracijai paimkime dalį duomenų apie pingvinus iš „R“ paketo „palmerpenguins“, kuriuose yra 2 gyvūnų lytys ir 3 rūšys:

  1. Duomenų lentelės pavidalo dviejų kintamųjų dažnių lentelės pavyzdys pateiktas lentelėje 4.1.
Lentelė 4.1. Duomenų lentelės pavidalo dviejų kintamųjų dažnių lentelės pavyzdys.
  Pingvinų rūšis       Lytis    Skaičius
1         Adelie   Patinėlis          73
2         Adelie      Patelė          73
3      Chinstrap   Patinėlis          34
4      Chinstrap      Patelė          34
5         Gentoo   Patinėlis          61
6         Gentoo      Patelė          58
  1. Matricos pavidalo dviejų kintamųjų dažnių lentelių (porinių dažnių lentelių) pavyzdžiai pateikti lentelėse 4.2, 4.3 ir 4.4.
Lentelė 4.2. Matricos pavidalo porinė dažnių lentelė. Pavyzdys – 1: tik absoliutieji dažniai.
              Pingvinų rūšis   Adelie   Chinstrap   Gentoo
      Lytis                                               
  Patinėlis                        73          34       61
     Patelė                        73          34       58

Sudėtingesnis porinės dažnių lentelės pavyzdys pateiktas lentelėje 4.3, kurioje be absoliučiųjų dažnių yra eilučių procentinė dalis kiekvienam stulpeliui bei stulpelių ir eilučių sumos.

Lentelė 4.3. Matricos pavidalo porinė dažnių lentelė. Pavyzdys – 2: absoliutieji ir santykiniai (pagal lytis) dažniai bei eilučių ir stulpelių sumos.
              Pingvinų rūšis         Adelie     Chinstrap         Gentoo         {Suma}
      Lytis                                                                            
  Patinėlis                     73 ( 50.0%)   34 ( 50.0%)    61 ( 51.3%)   168 ( 50.5%)
     Patelė                     73 ( 50.0%)   34 ( 50.0%)    58 ( 48.7%)   165 ( 49.5%)
     {Suma}                    146 (100.0%)   68 (100.0%)   119 (100.0%)   333 (100.0%)

Dar vienas išplėstinės porinės dažnių lentelės pavyzdys yra pateiktas lentelėje 4.4: čia pateikti absoliutieji dažniai (freq), bendroji (perc), eilučių (p.row) ir stulpelių (p.col) procentinės dalys bei eilučių ir stulpelių sumos (Sum).

Lentelė 4.4. Matricos pavidalo porinė dažnių lentelė. Pavyzdys – 3: išplėstinė lentelė su absoliučiaisiais ir santykiniais dažniais bei eilučių ir stulpelių sumomis.
                                                               
            Pingvinų rūšis   Adelie   Chinstrap   Gentoo    Sum
Lytis                                                          
                                                               
Patinėlis   freq                 73          34       61    168
            perc              21.9%       10.2%    18.3%  50.5%
            p.row             43.5%       20.2%    36.3%      .
            p.col             50.0%       50.0%    51.3%      .
                                                               
Patelė      freq                 73          34       58    165
            perc              21.9%       10.2%    17.4%  49.5%
            p.row             44.2%       20.6%    35.2%      .
            p.col             50.0%       50.0%    48.7%      .
                                                               
Sum         freq                146          68      119    333
            perc              43.8%       20.4%    35.7% 100.0%
            p.row                 .           .        .      .
            p.col                 .           .        .      .
                                                               

  1. Porinė dažnių lentelė dar vadinama sąveikos lentele (Čekanavičius ir Murauskas 2006, p.49).↩︎