1. Apie kursą, programas ir šią svetainę

Šioje svetainėje pateikiama pagalbinė medžiaga, skirta kurso „Biostatistika“ pratyboms. Svetainės tikslas – suteikti informacijos, kuri padėtų gerinti suvokimą ir praktinius įgūdžius, susijusius su duomenų parengimu ir analize kompiuteriu. Svetainėje susipažinsime su šio tipo analizei naudojamais įrankiais, tokiais kaip:

Ši svetainės pavidalo knyga orientuota į praktinius duomenų analizės aspektus. Teorinės temos bus išdėstytos arba paskaitų metu, arba kituose informacijos šaltinuose (pvz., konspekte „Biostatistinės analizės pagrindai“ ar kitur). Todėl prieš gilindamiesi į praktinius aspektus, būkite išsinagrinėję reikiamą su duomenų analizės teorija susijusią medžiagą.


Toliau šiame skyriuje bus:

  1. paaiškinta, kam skirtos programos „R“ ir „RStudio“,
  2. supažindinta, kaip efektyviai naudotis šia svetaine,
  3. išdėstyta, kokie įgūdžiai ir reikmenys reikalingi kurso studentui.

Kituose skyriuose bus paaiškinta tai, kaip įsidiegti reikiamas programas ir parengti jas darbui, bei tai, kaip jomis atlikti duomenų analizę.

1.1 R, RStudio ir R paketai

Šiame poskyryje sužinosime, kas yra „R“, „RStudio“ bei „R“ paketai ir kam jų reikia.

Tikslas – įgyti bendrą suvokimą, kas yra programos „R“ ir „RStudio“ bei „R“ paketai.

1.1.1 R – duomenų analizės įrankis

„R“ – tai duomenų analizei ir grafikų braižymui skirta kompiuterinė programa (pav. 1.1). Ji yra GNU projekto dalis: atviro kodo, visiškai nemokama ir laisvai platinama. Jos vystymu rūpinasi „R“ fondas (The R Foundation). Daugiau informacijos apie programą rasite svetainėje „CRAN“ adresu www.r-project.org (CRAN – The Comperhensive R Archive Network – tai pagrindinė oficiali internetinė programos „R“ su ja susijusių įrankių bei papildinių saugykla).

Programos „R“ logotipas [<i class="fa fa-external-link-alt" aria-hidden="true"></i>](https://www.r-project.org/){target="_blank"}.

Pav. 1.1: Programos „R“ logotipas .

Įspėjimas: programa „R“ nėra pakaitalas jūsų smegenų darbui.

„R“ yra iš tiesų galingas įrankis. Programą galima palyginti su rašikliu: be jo būtų sunku rašyti į sąsiuvinį, spręsti uždavinius, bet užrašų turinio kokybė priklauso tik nuo jūsų.

CRAN – pagrindinė (bet ne vienintelė) vieta, iš kurios siunčiamės „R“ papildinius, vadinamus paketais.

1.1.2 RStudio – palengvintas darbas programa R

Programa „RStudio“ (pav. 1.2) yra patogesniam darbui su „R“ skirta aplinka (integruota kūrimo (programavimo) aplinka, angl. IDE – integrated development environment).

„RStudio“ logotipas.
Iliustracijos šaltinis: [<i class="fa fa-external-link-alt" aria-hidden="true"></i>](https://www.rstudio.com/){target="_blank"}.

Pav. 1.2: „RStudio“ logotipas. Iliustracijos šaltinis: .

Jei kyla klausimas – „Ką mes iš tiesų naudojame analizei: R ar RStudio?“ – panagrinėkime tokią analogiją: kaip atitikmenį imkime automobilį. Jo variklis (darbinė jėga) būtų „R“. Kad ir koks tas variklis galingas, tiesiogiai jį valdyti traukiojant trosus ar darinėjant sklendes nebūtų patogu. Todėl mašinos salone yra sukurtas skyrius vairuotojui, kuriame – vairas, pedalai, spidometras, šviesų jungiklis, galinio matymo veidrodėliai, navigacija ir kiti mašinos valdymą palengvinantys įtaisai. Šioje analogijoje tai ir yra „RStudio“ (pav. 1.3). Tad atsakymas būtų toks: per „RStudio“ mes patogiai valdome programą „R“, kuri ir atlieka analizę.

„R“ – variklis„RStudio“ – patogiam valdymui skirta aplinka
DrawingDrawing

Pav. 1.3: Analogija tarp „R“, „RStudio“ bei automobilio. Per programą „RStudio“ valdome analizės „variklį“ – programą „R“, nes taip yra žymiai patogiau, nei valdyti „R“ tiesiogiai. Iliustracija pritaikyta iš Kim & McConville (CC BY-NC-SA).

Analizę atlieka „R“, o ne „RStudio“. Per „RStudio“ mes tiesiog patogiai valdome programą „R“.

Šio kurso metu naudosime asmeniniam kompiuteriui (o ne serveriui) skirtą programos versiją „RStudio Desktop“, kurią galima parsisiųsti iš „RStudio“ svetainės .

Užduotis 1.1

  1. Apibūdinkite, kas yra „R“ ir kas yra „RStudio“? Kuo skiriasi ir kodėl reikia dviejų programų?

1.1.3 Paketai – praplėstos R galimybės

Pati programa „R“ – tai kaip naujas telefonas, kuriame yra tik kelios standartinės („gamyklinės“) programėlės. Baziniam naudojimui jų gali visiškai pakakti. Bet norėdami labiau išnaudoti telefono galimybes, iš „App Store“, „Google Play“ ar kitos saugyklos atsisiunčiame papildomų, mūsų poreikių labiau atitinkančių „apps’ų“. Panašiai yra ir su „R“ – šios programos funkcionalumą smarkiai išplečia standartizuoti papildiniai, vadinami paketais (angl., packages), kurie leidžia spręsti įvairioms mokslo šakoms aktualius skaičiavimo ir duomenų analizės uždavinius, kurti grafikus, lenteles, automatizuotas „Word“, „Power Point“, PDF ar tinklalapio formato ataskaitas, rašyti mokslinius straipsnius, baigiamuosius darbus ir net knygas! Ši mokomoji medžiaga (svetainė), kurią dabar skaitote, taip pat sukurta naudojantis „R“!

„R“ – lyg naujas išmanusis telefonas„R“ paketai – tarsi programėlės, kurias galima parsisiųsti
DrawingDrawing

Pav. 1.4: Analogija tarp „R“, „R“ paketų ir mobiliojo telefono. Iliustracija pritaikyta iš Kim & McConville (CC BY-NC-SA).

Programoje „R“ terminai „paketas“ (angl. package) ir „biblioteka“ (angl. library) reiškia skirtingus dalykus:

  • („R“) paketas yra standartizuotas papildinys,
  • („R“) biblioteka yra aplankas, kuriame saugomi įdiegti paketai.

Dažnai terminas „biblioteka“ vartojamas netinkama prasme.

Prisiminkite, kad kiekvieną kartą prieš naudojant funkcijas iš paketo, tą paketą (kaip ir programėlę telefone) reikia atsidaryti. Paketai (išskyrus kelis, be kurių „R“ neveiktų) automatiškai uždaromi išjungus ar perkrovus „R“. Tokiu atveju reikiamus paketus privalome užsikrauti iš naujo.


1.2 Apie šią svetainę

Ši svetainė pateikta elektroninės knygos „Git Book“ formatu. Tad joje sujungtos ir elektroninės knygos, ir interneto svetainės galimybės.

Tikslas – išmokti (efektyviau) naudoti šioje svetainėje pateiktus resursus.

1.2.1 Pasiūlymai ir netikslumų taisymas

Jei svetainėje rasite netikslumų ar klaidų (fakto, loginių, rašybos, skyrybos ar kitokių), apie jas praneškite užpildydami vieną iš formų taisymai-2024 svetainėje (spauskite „New issue“; reikia būti prisijungus prie savo „GitHub“ paskyros). Taip pat, jei turite pasiūlymų, kaip pagerinti šią svetainę, juos pateikite užpildydami vieną iš nurodytų formų.

1.2.2 Svetainės valdymas klavišais

Šios svetainės valdymas klaviatūra:

  • Norėdami paslėpti (ar vėl rodyti) turinį, paspauskite klavišą S.
  • Naudodami rodykles ar , galite pereiti į kitą skyrių.
  • Norėdami atlikti paiešką visoje svetainėje, paspauskite klavišą F. Atsiras specialus paieškos laukelis. Funkcija veikia ne visose naršyklėse.
  • Norėdami atlikti paiešką viename tinklalapyje (t. y., viename skyriuje), paspauskite Ctrl+F.

1.2.3 Dėžučių reikšmės

Svetainėje naudojamų spalvotų dėžučių reikšmės:

Informacija.

Užduotys.

Rekomendacija arba pastaba.

Pastaba.

Įspėjimas ir vengtini dalykai.

1.2.4 Video medžiaga

Šio kurso metu kai kurios temos bus pristatomos video epizodų formatu. Epizodai bus talpinami platformoje „YouTube“ ir įterpti reikiamose šios svetainės vietose. Patarimai, kaip efektyviau žiūrėti mokomuosius video epizodus, pateikiami epizode 1.1.


Video epizodas 1.1 Patarimai, kaip žiūrėti mokomuosius video epizodus efektyviau: pasirinkite tinkamą greitį ir vaizdo kokybę.


Svetainėje esanti mokomoji medžiaga yra orientuota į operacinės sistemos „Windows“ vartotojus. Kitų sistemų vartotojams kai kurios instrukcijos gali šiek tiek skirtis.

1.3 Reikmenys ir įgūdžiai

1.3.1 Įgūdžiai

Prieš pradėdamas šį kursą studentas turi turėti šiuos įgūdžius:

  1. Anglų kalba (gebėjimas analizuoti specialybinę ir su statistika susijusią literatūrą, audio ir video šaltinius; bent B2 lygis).
  2. Darbo kompiuteriu įgūdžiai:
    1. elementaraus kompiuterinio raštingumo įgūdžiai;
    2. gebėjimas internete savarankiškai susirasti reikiamą informaciją: „Google Search“, „YouTube“, „Stack Overflow“, t.t.;
    3. gebėjimas pagal instrukcijas parsisiųsti ir įsidiegti reikiamas programas;
    4. mokėjimas skaityti programos sugeneruotas įspėjimo ar klaidos žinutes ir su „Google Search“, „YouTube“ ir panašių įrankių/platformų pagalba susirasti sprendimą.
  3. Bent bazinės specialybinės žinios, susijusios su biologija, genetika, medicina ir kitomis biomedicininėmis temomis (tam, kad su biologija susijusių uždavinių esmė iš specialybinės pusės būtų aiški).

1.3.2 Reikmenys paskaitoms

Biostatistikos paskaitoms reikalingi:

  1. Mobilusis telefonas arba kompiuteris su interneto ryšiu ir interneto naršykle (spręsti testus, atsakinėti į klausimus).
  2. Sąsiuvinis, užrašai, rašiklis ir kitos priemonės, skirtos konspektuoti ir spręsti uždavinius.

Biostatistikos paskaitų metu reikia turėti: (1) įrenginį su interneto ryšiu ir (2) užrašus.

1.3.3 Reikmenys pratyboms

Įvado į duomenų analizę programa „R“ užsiėmimams ir biostatistikos pratyboms:

  1. Nuosavos ausinės yra privalomos kiekvienų pratybų auditorijoje metu (video resursų peržiūrai).
  2. Sąsiuvinis, užrašai, rašiklis ir kitos priemonės, skirtos konspektuoti.
  3. Rekomenduojama naudoti nuosavą, o ne klasės kompiuterį, kuriame yra „R“, „RStudio“ ir kitos reikiamos programos.
  4. Jei neatsinešite kompiuterio, tada turėkite USB atmintinę.

Pratybų klasėje metu reikia turėti: (1) nuosavas ausines, (2) nuosavą kompiuterį arba USB atmintinę ir (3) užrašus.

1.3.4 Reikmenys darbui namuose ir nuotoliniam mokymuisi

  1. Kompiuteris su „Windows“, „Linux“ arba „Mac OS“ operacine sistema.
  2. Įdiegtos reikiamos programos („MS Teams“, „MS Office“, „R“, „RStudio“ ir kitos) bei reikiami „R“ paketai. Apie programų diegimą bus rašoma atskirai.
  3. Stabilus (geriausia „laidinis“) interneto ryšys.
  4. Sąsiuvinis, užrašai, rašiklis ir kitos priemonės, skirtos konspektuoti.
  5. Nuotoliniams užsiėmimams (jei tokie vyks): mikrofonas, video kamera – nuotoliniam bendravimui, ausinės (siekiant išvengti aido). Dažnai šiuos reikalavimus tenkina ir mobilusis telefonas.

Informacijos šaltiniai

R Core Team R: A Language and Environment for Statistical Computing. Vienna, Austria: R Foundation for Statistical Computing (2024). Prieiga per internetą: https://www.R-project.org/.
RStudio Team RStudio: Integrated Development Environment for R and Python. Boston, MA: RStudio, PBC (2022). Prieiga per internetą: https://posit.co/products/open-source/rstudio/.