Mikä R?
R on ilmainen avoimen lähdekoodin (engl. Open Source) ohjelmointikieli ja -ympäristö. Kieli soveltuu parhaiten statistiikkaan, mallintamiseen, aikasarja-analyysiin, datan käsittelyyn ja visualisoimiseen. Kyseessä on puhdas ohjelmointikieli jota voi käyttää muuhunkin, mutta se näkee eniten käyttöä edeltävissä. R-kieleen on olemassa paljon laajennuksia ja lisäpakkauksia laajalta ja omistautuneelta yhteisöltä, jotka mahdollistavat esimerkiksi koneoppimista, monimutkaista visualisaatiota ja rinnakkaislaskentaa. R-kieli onkin yksi käytetyimmistä matemaattisista ohjelmointikielistä! [1]

Miten työskennellä R:n kanssa?
Perus-R (engl. Base R) voi itsessään käyttää kahdella tavalla: komentorivi-käyttöliittymällä (engl. Command Line Interface, lyh. CLI) tai kirjoittamalla koodin ".r"-tiedostoon, ja ajamalla sen komentoriviltä. Tämä on täysin toimivaa, mutta kuten muiden vastaavasti toimivien ohjelmointikielien kanssa (esim. Python), käyttäjäystävällisin tapa työskennellä R-ohjelmien kanssa on käyttää jotakin kolmannen osapuolen tuottamaa integroitua kehittely-ympäristöä (engl. Integrated Development Enviroment, lyh. IDE).

Yleisesti suositeltu ja tälläkin kurssilla käytössä on "RStudio Desktop" [https://www.rstudio.com/]; pitäytyen teemassa, RStudio on ilmainen avoimeen lähdekoodiin ja yhteisön kehittämiseen omistautunut projekti. Edellä linkatulta sivulta löytyy IDE:n lisäksi laadukkaita resursseja R-ohjelmoinnin ja data-analyysin oppimiseen ja opettamiseen.

Millä aloilla R:ää käytetään? Miksi opetella?
Kuten edellä mainittu, R on laajasti käytössä data-analyysissä. Data-analyysi on tärkeä työkalu finanssi-alalla, empiirisessä ja kvantitatiivisessa tutkimuksessa sekä datalouhinnassa (engl. Data mining). Vaikka et olisikaan suuntaamassa näille aloille, datan kerääminen, järjestely ja analyysi kasvaa tärkeydessä joka alalla. Hakemalla esimerkiksi LinkedInissä "Data Analyst"-työpaikkoja, näkee että analyysiä tehdään lähes joka firmassa ja alalla; vähintäänkin alan tutkimuksessa.

Lisäksi kaikki yritykset eivät suostu maksamaan kaikkien kaupallisten ohjelmistojen lisenssejä hyvinkin korkean hinnan takia; MATLAB on hyvä esimerkki tästä. Kaupallisessa käytössä yhden käyttäjän lisenssi maksaa lähes tuhat euroa vuodessa, johon verrattuna R:n ja RStudion ilmaisuus on erittäin houkutteleva vaihtoehto.

Täten R:stä kannataa olla jonkintasoinen ymmärrys, vaikka pelkkä MATLAB riittää ainakin opintojen aikana.

Viitteet:
[1]: (Tiobe.com. 2022. index | TIOBE - The Software Quality Company. [online] Available at: <https://www.tiobe.com/tiobe-index/> [Accessed 19 March 2022].)

Viimeksi muutettu: tiistaina 3. toukokuuta 2022, 21.29