
1. Apie kursą ir šią svetainę
Šioje svetainėje pateikiama pagalbinė medžiaga, skirta kursų „Biostatistika“ ir „Įvadas į duomenų analizę programa R“ pratyboms. Svetainės tikslas – suteikti informacijos, kuri padėtų lavinti suvokimą ir praktinius įgūdžius, kaip atlikti statistinę (kiekybinę) duomenų analizę kompiuteriu. Svetainėje susipažinsime su statistinei analizei naudojamais įrankiais, tokiais kaip:
- programa ir analizės kalba „R“ ir jos sintakse;
- patogesniam darbui su „R“ skirta aplinka (programa) „RStudio“: \(R \neq RStudio\)!
- ataskaitų rengimui skirtomis „R“ galimybėmis, pvz., „R Markdown“ dokumentais;
- kitais įrankiais.
Tačiau šioje svetainėje vengiama su statistikos teorija susijusių temų ir daroma prielaida, kad skaitytojas su jomis yra pakankamai gerai susipažinęs. Teorinėms temoms yra skirta atskira svetainė mokymai.github.io/teorija-2020 . Todėl, prieš gilinantis į praktinius aspektus, siūlau būti išsinagrinėjus reikiamą su analizės teorija susijusią medžiagą.
Kiti reikalavimai studentui:
- Anglų kalba (gebėjimas analizuoti specialybinę ir su statistika susijusią literatūrą, audio ir video šaltinius).
- Darbo kompiuteriu įgūdžiai:
- elementaraus kompiuterinio raštingumo įgūdžiai;
- gebėjimas internete susirasti reikiamą informaciją: „Google Search“, „YouTube“, t.t.;
- gebėjimas pagal instrukcijas parsisiųsti ir įsidiegti reikiamas programas;
- mokėjimas skaityti programos sugeneruotas įspėjimo ar klaidos žinutes ir su „Google Search“, „YouTube“ ir panašių įrankių pagalba susirasti sprendimą.
- Bazinės žinios, susijusios su biologija, medicina ir kitomis biomedicininėmis temomis (tam, kad kai kurių uždavinių esmė iš specialybinės pusės būtų aiški).
Toliau šiame skyriuje bus paaiškinta, kaip naudotis šia svetaine, kam skirtos programos „R“ ir „RStudio“ ir kaip pasiruošti kiekvienoms pratyboms klasėje. Tolimesniuose skyriuose bus paaiškinta, kaip įsidiegti reikiamas programas ir parengti jas darbui, bei kaip jas naudoti norint atlikti analizę.
1.1 Apie šią svetainę
Ši svetainė pateikta elektroninės „Git Book“ knygos formatu. Tad joje sujungtos ir elektroninės knygos, ir interneto svetainės galimybės.
Tikslas – išmokti (efektyviau) naudoti šioje svetainėje pateiktus resursus.
1.1.1 Pasiūlymai ir netikslumų taisymas
Jei svetainėje rasite netikslumų ar klaidų (fakto, loginių, rašybos, skyrybos ar kitokių), apie jas praneškite užpildydami vieną iš šių formų . Taip pat, jei turite pasiūlymų, kaip pagerinti šią svetainę, juos pateikite užpildydami vieną iš nurodytų formų.
1.1.2 Svetainės valdymas klavišais
Šios svetainės valdymas klaviatūra:
- Norėdami paslėpti (ar vėl rodyti) turinį, paspauskite klavišą S.
- Naudodami rodykles ← ar →, galite pereiti į kitą temą.
- Norėdami atlikti paiešką visoje svetainėje, paspauskite klavišą F. Atsiras specialus paieškos laukelis. Funkcija veikia ne visose naršyklėse.
- Norėdami atlikti paiešką viename tinklalapyje (t. y., viename skyriuje), paspauskite Ctrl+F.
1.1.3 Dėžučių reikšmės
Svetainėje naudojamų spalvotų dėžučių reikšmės:
Informacija.
Užduotys.
Rekomendacija arba pastaba.
Pastaba.
Įspėjimas ir vengtini dalykai.
1.1.4 Video medžiaga
Šio kurso metu kai kurios temos bus pristatomos video epizodų formatu. Epizodai bus įterpti reikiamose šios svetainės vietose. Visą epizodų grojaraštį rasite „YouTube“ portale paspaudę šią nuorodą (prieinama tik kurso studentams). Patarimai, kaip žiūrėti mokomuosius video epizodus, pateikiami epizode 1.1.
1.1.5 Kitos svetainės ypatybės
Ypatybė 1. Kiekvieno skyriaus gale yra vieta (DISQUS forumas), kurioje galite pateikti komentarą, patarimą, pastabą ar klausimą. Būkite mandagūs, tolerantiški, supratingi, laikykitės raštvedybos ir kitų universiteto studentams prideramų taisyklių.
Ypatybė 2. Svetainėje esanti mokomoji medžiaga yra orientuota į operacinės sistemos „Windows“ naudotojus. Kitų sistemų naudotojams kai kurios instrukcijos gali šiek tiek skirtis.
Ypatybė 3. Lokalė – kompiuteryje ir jo programinėje įrangoje naudojamų elementų, priklausančių nuo kalbos ir kultūros normų, visuma (šaltinis: ). Paprasčiau sakant – tai nuo kalbos ir vietovės (valstybės) priklausančios programų bei dokumentų savybės, pvz., mėnesių pavadinimai skirtingomis kalbomis. Detalesnį paaiškinimą galite rasti enciklopediniame kompiuterijos žodyne . Daugelis šioje svetainėje rodomų pavyzdžių pateikti darant prielaidą, kad programoje „R“ pasirinkta lietuviškoji lokalė, kurią nustatyti galite naudodami programos „R“ komandą:
# „Mac OS“ ir kai kurioms „Linux“ versijoms
Sys.setlocale(locale = "lt_LT.UTF-8")
Sys.setlocale(locale = "lt_LT.utf8")
„Mac OS X“ ir „Linux“ sistemų naudotojai visas įdiegtas lokales gali sužinoti parašę „R“ komandą system("locale -a")
. Įprastai lokalę reikia pakeisti kiekvieną kartą perkrovus programą „R“. Jei programoje „R“ nustatyta lokalė veikia neteisingai, įsitikinkite, kad jūsų kompiuterio operacinės sistemos lokalė taip pat lietuviška (kai kuriais atvejais, operacinės sistemos lokalė gali užgožti programoje „R“ nustatytąją).
1.2 R, RStudio ir R paketai
Šiame skyriuje sužinosime, kas yra „R“, „RStudio“ bei „R“ paketai ir kam jų reikia.
Tikslas – įgyti bendrą suvokimą, kas yra programos „R“ ir „RStudio“ bei „R“ paketai.
1.2.1 R – duomenų analizės įrankis
„R“ – tai duomenų analizei ir grafikų braižymui skirta kompiuterinė programa (pav. 1.1), kuri yra GNU projekto dalis: atviro kodo, visiškai nemokama ir laisvai platinama. Jos vystymu rūpinasi „R“ fondas (The R Foundation). Daugiau informacijos apie programą rasite svetainėje „CRAN“ adresu www.r-project.org . (CRAN – comperhensive R archive network – tai pagrindinė oficiali internetinė programos „R“, kai kurių su ją susijusių įrankių bei „R“ paketų saugykla).
„R“ yra iš tiesų galingas įrankis. Programą galima palyginti su rašikliu: be jo būtų sunku rašyti į sąsiuvinį, spręsti uždavinius, bet užrašų turinio kokybė priklauso tik nuo jūsų.
1.2.2 RStudio – palengvintas darbas programa R
„RStudio“ (pav. 1.2) yra patogesniam darbui su „R“ skirta programa (taip vadinama integruota kūrimo aplinka, angl. IDE – integrated development environment).
Jei kyla klausimas – „Ką mes iš tiesų naudojame analizei: R ar RStudio?“ – panagrinėkime tokia analogiją: kaip atitikmenį imkime automobilį. Jo variklis (darbinė jėga) būtų „R“. Kad ir koks tas variklis galingas, tiesiogiai jį valdyti traukiojant trosus ar darinėjant sklendes nebūtų patogu. Todėl yra mašinos salone yra sukurtas skyrius vairuotojui, kuriame – vairas, pedalai, spidometras, šviesų jungiklis, galinio matymo veidrodėliai, navigacija ir kiti mašinos valdymą palengvinantys įtaisai. Šioje analogijoje tai ir yra „RStudio“ (pav. 1.3). Tad atsakymas būtų toks: per „RStudio“ mes patogiai valdome programą „R“, kuri ir atlieka analizę.
Rekomenduoju peržiūrėti trumpą „RStudio“ video pristatymą anglų kalba (2:46 min).
„R“ – variklis | „RStudio“ – patogiam valdymui skirta aplinka |
---|---|
![]() | ![]() |
Pav. 1.3: Analogija tarp „R“, „RStudio“ bei automobilio. Per programą „RStudio“ valdome analizės „variklį“ – programą „R“, nes taip yra žymiai patogiau, nei valdyti „R“ tiesiogiai. Iliustracija pritaikyta iš Kim & McConville (CC BY-NC-SA).
Šio kurso metu naudosime asmeniniam kompiuteriui (o ne serveriui) skirtą programos versiją „RStudio Desktop“, kurią galima parsisiųsti iš „RStudio“ svetainės .
Užduotis 1.1
- Peržiūrėkite programos „RStudio“ video pristatymą .
- Apibūdinkite, kas yra „R“ ir kas yra „RStudio“? Kuo skiriasi ir kodėl reikia dviejų programų?
1.2.3 Paketai – praplėstos R galimybės
Pati programa „R“ – tai kaip naujas telefonas, kuriame yra tik kelios standartinės („gamyklinės“) programėlės. Baziniam naudojimui jų gali visiškai pakakti. Norėdami labiau išnaudoti telefono galimybes, iš „App Store“, „Google Play“ ar kitos saugyklos atsisiunčiame papildomų, mūsų poreikių labiau atitinkančių „apps’ų“. Panašiai yra ir su „R“ – šios programos funkcionalumą smarkiai išplečia standartizuoti papildiniai, vadinami paketais (angl., packages), kurie leidžia spręsti įvairioms mokslo šakoms aktualius skaičiavimo ir duomenų analizės uždavinius, kurti grafikus, lenteles, automatizuotas „Word“, „Power Point“, PDF ar tinklalapio formato ataskaitas, rašyti mokslinius straipsnius, baigiamuosius darbus ir net knygas! Ši mokomoji medžiaga (svetainė), kurią dabar skaitote, taip pat sukurta naudojantis „R“!
„R“ – lyg naujas išmanusis telefonas | „R“ paketai – tarsi programėlės, kurias galima parsisiųsti |
---|---|
![]() | ![]() |
Pav. 1.4: Analogija tarp „R“, „R“ paketų ir mobiliojo telefono. Iliustracija pritaikyta iš Kim & McConville (CC BY-NC-SA).
Prisiminkite, kad kiekvieną kartą prieš naudojant funkcijas iš paketo, tą paketą (kaip ir programėlę telefone) reikia atsidaryti. Paketai (išskyrus kelis, be kurių „R“ neveiktų) automatiškai uždaromi išjungus ar perkrovus „R“. Tokiu atveju reikiamus paketus privalome užsikrauti iš naujo.
1.3 Kaip pasirengti konkrečioms pratyboms?
Tikslas – išmokti tinkamai pasirengti atlikti užduotis pratybų metu.
1.3.1 Reikmenys pratyboms
- Nuosavos ausinės pratybų metu (privaloma).
- Užrašai ar kitos priemonės, skirtos konspektuoti.
- USB raktas (atmintinė).
- (Jei studentas nori!) Kompiuteris su „Windows“, „Linux“ arba „Mac OS X“ operacine sistema, kuriame galima įdiegti reikiamas programas.
Pratybų metu reikia turėti nuosavas ausines ir USB atmintinę.
1.3.2 Reikmenys darbui namuose
- Kompiuteris su „Windows“, „Linux“ arba „Mac OS X“ operacine sistema namų darbams atlikti, kuriame galima įdiegti reikiamas programas.
1.3.3 Parengiamieji etapai namie
„Emokymai“ sistemoje bus pateikti nurodymai, ką reikia atlikti namuose norint pasirengti būsimoms pratyboms. Įprastai reikės susipažinti su teorine medžiaga bei pasitikrinti, ar jūsų kompiuteryje yra įdiegti reikiami „R“ paketai.
1.3.4 Lankomumo žymėjimas
Pratybų lankomumas ir pasirengimas pratyboms yra privalomi. Kiekvienų pratybų pradžioje savarankiškai pasižymėkite lankomumą sistemoje „Emokymai“. Tai galima atlikti tik iš klasės kompiuterio. Žymintis lankomumą reikia pažymėti, ar esate pasirengę atsakinėti (t. y., ar atlikote namų darbą/pasirengimą). Kai kurių savaičių metu pasirengimas pratyboms nebus vertinamas, tad užteks pažymėti, kad galite atsakinėti. Apie tai informuos dėstytojas.
1.3.5 Klasės kompiuterio parengimas pratyboms
Prieš atsisiųsdami ar įsikeldami pratyboms reikiamą medžiagą į klasės kompiuterį, jūs turite pasiruošti kompiuterį (programą „RStudio“) darbui. Kaip tai atlikti, demonstruojama video epizode 1.2. Prieš vykdydami programos kodą, prisiminkite, kad reikia uždaryti „RStudio“ projektą, jei jis yra atidarytas. Šis paruošimas ne tik atstato programos „RStudio“ būseną bet ir ištrina darbalaukyje esančio aplanko „BS-2020“ turinį arba šį aplanką sukuria (jei jo nėra).
Šio poskyrio nurodymai netaikytini, jei dirbate nuosavu kompiuteriu.
1.3.6 Pratybų resursų išsiskleidimas
Pratybų medžiaga bus pateikta kaip zip formato archyvas. Video epizodas 1.3 moko, kaip tinkamai iš šio archyvo pasiimti aplanką su resursais.
Jei dirbate klasės kompiuteriais, visą reikiamą medžiagą turėtumėte įsikelti į aplanką „BS-2020“, esantį darbalaukyje, arba į savo USB atmintinę. Po darbo, „RStudio“ projektą, kuriame dirbote, turėtumėte išjungti ir visą darbalaukyje esančio aplanko „BS-2020“ turinį ištrinti.
Jei dirbate nuosavais kompiuteriais, medžiagą turėtumėte įsirašyti į bet kokį aplanką, kurio pavadinime (nei vienoje pavadinamo dalyje) nėra ne angliškų simbolių. Jei bus, pvz., lietuviškų raidžių, kils problemų ir net nesuprasite, kad jos atsiranda būtent dėl netinkamo aplanko pavadinimo.