Topic outline

  • Tervetuloa kurssille ISM-C1002 - Tilastotieteen ja data-analytiikan jatkokurssi!

    Kurssin avaus ja ensimmäinen luento pidetään maanantaina 8.1. klo 13.15–16.00 salissa C202 (Tietotekniikan talo, T1). Kuten kurssin nimestäkin käy ilmi, data-analyyysi on kurssilla keskiössä  — otathan oman läppärisi mukaan luennoille mikäli mahdollista, sillä kurssin luennoilla tehdään paljon aktivoivia harjoituksia (kts. kohdat "Kurssiaikataulu" ja "Luennoista" alla).


    Kurssin tavoite

    Kurssi on nimensä mukaisesti jatkokurssi aiemmille peruskursseille, jossa toisaalta opiskellaan lisää teoreettista pohjaa sekä tehdään paljon käytännön tilastollisia sovelluksia. Kurssin tavoitteena on tarjota hyviä valmiuksia myöhempiä menetelmätieteiden opintoja varten sekä muun muassa mahdollista kandityötä varten.


    Kurssin sisältö

    Kurssilla opiskellaan sekä teoriaa että käytäntöä, ja käytäntöä toteutetaan erityisesti R-ohjelmistolla. Sisältöön kuuluu peruskursseja vaativampaa matemaattisia sisältöä, mutta tätä ei kuitenkaan tarvitse pelästyä - hyvällä perustason lukiomatematiikalla ja hyvällä opiskeluasenteella tästä selvitään aivan varmasti. Kurssin matematiikka kurssilla on työvälineluontoista — ei kurssin pääfokus. Kurssin aikana tehdään paljon käytännön soveltavia tilastoanalyysejä R-kieltä käyttäen ja R:ään tutustuminen on yksi kurssin oppimistavoitteita. R:ää opiskellaan sekä teknisestä näkökulmasta että hyvien ja järkevien työskentelytapojen näkökulmasta. Kurssi ei kuitenkaan ole varsinainen puhdas kaikenkattava R-kurssi, vaan R on enemmänkin kurssin työväline - joskin tätä kautta R:ään hyvän pohjan, jonka päälle pystyy hyvin rakentamaan lisäosaamista. 


    Esitietovaatimukset
    Kurssilla oletetaan tunnetuksi kurssien Tilastotieteen perusteet (30A02000) sekä Taulukkolaskenta ja analytikka / Johdatus Data-analytiikkaan sisällöt tai siihen verrattavat asiakokonaisuudet. Erityisesti oletetaan hyvät pohjatiedot kurssilta Tilastotieteen perusteet tai muut vastaavat tiedot. Hyvä arvosana em. kurssilta ei kuitenkaan automaattisesti tarkoita hyviä pohjatietoja ja on mahdollista, että opiskelija joutuu kertaamaan näitä asioita itsenäisesti. Tällä kurssilla kertausta tilastotieteiden perusteista tehdään vain paikoitellen ja kevyesti - mahdolliset puutteet näissä aihealueissa joutuu opiskelija paikkaamaan itse ja on siis lähtökohtaisesti itse vastuussa näistä. Tähän paikkailuun voi käyttää esimerkiksi kurssin Tilastotieteen perusteet vanhaa kurssisivua.  

    Edellä mainitun kahden ennakkotietokurssin matemaattisen sisällön lisäksi opiskelijalta edellytetään myös vähintään lukiomatematiikan lyhyen oppimäärän hallintaa . Mikäli lukion (pitkästä) matematiikasta tai muualta on perusintegrointi tuttua, niin siitä on etua, mutta tämä ei missään nimessä ole ennakkovaatimus. 

    Kurssin aikataulu:
    • Ma klo 13.15-16.00: uuden opiskelupaketin sisällön läpikäyntiä. Tätä sessiota varten opiskelijan tulee tutustua etukäteen itsenäisesti aiheen teoriasisältöön. Sessiossa tehdään myös harjoituksia joko R:llä tai kynällä-paperilla. Oma R:llä varustettu tietokone on hyvin suositeltava.
    • Pe klo 13.15-15.00: harjoitustehtäväsessio, jossa käydään läpi opiskelupaketin palautettavat tehtävät sekä tarpeen mukaan täydennetään ja kerrataan opiskeltua aihepiiriä.
    Katso luentojen ja laskuharjoitusten tarkempi aikataulu SISUsta!

    Kurssin oma laskupaja
    Kurssilla on käytössä myös oma vapaaehtoinen laskupaja, jonne voi oman tarpeen mukaan mennä kyselemään neuvoja kyseisen viikon laskaritehtäviin (ja kurssin asioista ylipäänsä). Pajan tarkoitus on siis auttaa opiskelijaa eteenpäin oivaltamaan tehtävän ratkaisu mahdollisimman itsenäisesti, ei tarjota suoria vastauksia / ratkaisuja tehtäviin. Pajaa pitää kurssiassistentti Tommi Raita.


    Laskupajan aikataulu
    ViikkoPvmKloLuokkatila
    09Ti 27.02.202415:15-17:00A136 T6
     Ke 28.02.202413:15-15:00U406a
    10Ti 05.03.202415:15-17:00A136 T6
     Ke 06.03.202413:15-15:00U406a
    11Ti 12.03.202415:15-17:00A136 T6
     Ke 13.03.202413:15-15:00U406a
    12Ti 19.03.202415:15-17:00A136 T6
     Ke 20.03.202413:15-15:00U406a
    13Ti 26.03.202415:15-17:00A136 T6
     Ke 27.03.202413:15-15:00U406a
    15Ti 09.04.202415:15-17:00A136 T6
     Ke 10.04.202413:15-15:00U406a

    • Luokka U406a sijaitsee osoitteessa Otakaari 1 (Kandidaattikeskus),
    • Luokka A136 T6 sijaitsee osoitteessa Konemiehentie 2 (Tietotekniikan talo).

    Osallistumalla säännöllisesti live-sessioihin
    • Kurssin sisältö ja merkitys näyttäytyy paljon antoisammalta ja relevantimmalta
    • Takaa huomattavasti paremman sisällöllisen osaamisen ja ymmärryksen
    • Takaa usein paremman kurssiarvosanan ja usein vieläpä vähemmällä työllä ja stressillä (win-win)
    Erityisesti kannattaa huomata, että kurssin sisältöön kuuluu peruskursseja enemmän esimerkiksi asioiden merkitysten ja yhteyksien rakentamista, erilaisten käytäntöjen pohdintaa sekä työtapa-asioita. Näitä käydään läpi ainoastaan live-sessioissa.  Kurssilla ei ole pakollisia läsnäoloja ja kurssia on siis periaatteessa mahdollista suorittaa myös ilman säännöllistä osallistumista live-sessioihin. Kannattaa kuitenkin huomata, että kurssi on huomattavasti hankalampi täysin itsenäisesti opiskellen — ja täysin itseopiskeltavaksi selkeästi hankalampi kuin esimerkiksi kurssi Tilastotieteen perusteet.

    Kurssitentti
    Pe 19.4. klo 13.00-16.00  (useita saleja, tiedotetaan myöhemmin)


    Kurssiaikataulu
    Alustava kurssiaikataulu on seuraavanlainen (päivittyy kurssin edetessä, viimeisin päivitys 5.4.):

    Vko
    Aihe
    Perehdy ennakkoon
    1 M0. Johdanto. R-softan käytön harjoittelua. Tee Alkukysely. Jos mahdollista, asenna R ja RStudio (ohjeet lohkossa R-materiaalia: R-ohjelmointikielen ja RStudion asentaminen sekä RStudion käyttö)
    2 M1. Jatkuvat ja diskreetit jakaumat, tiheysfunktiot. Lisää R-softan perusasioita (R Markdown ja LaTeX). Lue M1. Ennakko osat 1–2 (lukiomatematiikan kertausta / täydennystä) ja M1 Teoriamateriaali, sivut 1–5. Katso videot R Koulu: R Markdown 1–3 (lohkosta R-materiaalia: R Markdown-ohjeita)
    3
    M1. Jatkuvat ja diskreetit jakaumat, tunnusluvut.
    Lue M1: Teoriamateriaali, sivut 6–10 (kertaa tarvittaessa Tilastotieteen peruskurssin "Satunnaismuuttujat ja jakaumat" -kalvot 20-48). Katso videot R-Koulu 6-8.
    4
    M1. Muutamia yleisiä "testijakaumia": esim F-jakauma, khii-toiseen-jakauma
    Lue M1: Teoriamateriaali, sivut 11–17. Katso video R-Koulu 10: Loopit eli silmukat + apply.
    5
    M2. Eksponentiaalinen jakauma, Gamma-jakauma, Poisson-jakauma: tunnuslukuja ja sovelluksia
    Lue M2: Teoriamateriaali, sivut 1–9. Katso video R-koulu 11: Omat funktiot.
    6 M3. Moniulotteisia jakaumia: yhteisjakauma, kertymäfunktio, tiheysfunktio. Moniulotteinen Gaussinen jakauma Vilkaise ensin moniulotteisista integraaleista tämä ja etenkin tämä (huom! Esimerkki 1 (c)-(e) ja Esimerkki 2 eivät kuulu kurssin vaatimuksiin) - noteeraa erityisesti Esimerkki 1 (a) ja (b) sekä Fubinin lause (Fubini's theorem). Lue M3: Teoriamateriaali, sivut 16 (pl. "Satunnaismuuttujien riippuvuus tai riippumattomuus", "Multinomijakauma")

    Väliviikko 19.2.–25.2.
    7
    M3. Lisää moniulotteisista jakaumista: reunajakaumat, ehdolliset jakaumat, tunnuslukujen laskemista Lue M3: Teoriamateriaali, sivut 715 , "Satunnaismuuttujien riippuvuus tai riippumattomuus" s. 12, lue R-tutuksi luku 4.2.
    8
    M4. Testejä, osa I. Hypoteesitestausta (parametrinen tapaus) Lue M4: Teoriamateriaali, sivut 14
    9
    M5. Testejä, osa II. Ei-parametrisiä testejä Lue M5: Teoriamateriaali, sivut 111
    10 M6. Lineaarinen regressio, monen muuttujan lineaarinen regressio Lue M6: Teoriamateriaali, sivut 19
     11 M6. Lisää usean muuttujan lineaarista regressiota Lue M6: Teoriamateriaali, sivut 1014, lue R-tutuksi luku 6.3: If else-rakenne
       Väliviikko 28.3.–3.4.
     
     12 M7. Uskottavuuspäättely. Logistinen regressio. Poisson-regressio.  Lue M7: Teoriamateriaali, sivut 510


    Luennoista
    Kurssin luennot eivät ole perinteisiä "yksi puhuu - muut kuuntelee" -monologeja, vaan kurssilla on käytössä ns. blended teaching-menetelmä. Idea on että opiskelijat tutustuvat kunkin viikon teeman kurssimateriaaliin (kts. kohta kurssimateriaali alla) etukäteen ennen luentoa, ja luennoilla keskitytään asioiden syventämiseen ja soveltamiseen. Luennoilla kerrataan materiaalista korkeintaan joitakin ydinkohtia, ja pääfokus on viikkoteemaan liittyvien laskuesimerkkien läpikäyminen yksin tai pareittain, luennoitsijan antaessa tarvittavaa taustatukea. Katso tarkempi aikataulutus yllä olevasta taulukosta kohdasta "Perehdy ennakkoon" tietääksesi mitä kannattaa olla luettuna ennen mitäkin luentoa.

    Kurssimateriaali
    Kurssimateriaalina toimivat luentodiat sekä Panu Erästön kirjoittama teoriapaketti. Nämä löytyvät alakohtiin M1-M7 ryhmiteltynä kurssisivun vasemmasta sivupalkista.

    Laskuharjoitukset
    Kurssin laskuharjoitustehtävät koostuvat perinteisemmistä "kynä & paperi"-tehtävistä, sekä R-softalla toteutetuista tilastollisen päättelyn tehtävistä, nämä löytyvät lohkosta "Harjoitukset". Kunkin tehtäväkierroksen laskuharjoitustehtävien ratkaisut palautetaan sähköisesti yhtenä R Markdown-tiedostona (.Rmd) MyCoursesissa kullekin kierrokselle merkittyyn palautuslaatikkoon, löytyy lohkosta "Harjoitukset".

    Laskuharjoitustilaisuuksissa käydään läpi viikon tehtävien ratkaisuja. Huomaa, että ensimmäissä tehtävissä on jatkettu DL: palautus vasta 19.1. joka on yhteinen kakkosharjoitusten kanssa! Ensimmäinen laskuharjoitustilaisuus 12.1. käytetäänkin poikkeuksellisesti R / RStudio-tukipajana, jonne saa tulla vapaaehtoisesti ja vapaamuotoisesti kysymään apua tehtävien kanssa käyntiin pääsemisessä. Harjoitusten palautusten päivämäärät (huomaa, että palautus on aina ennen laskuharjoitustilaisuutta, eli viimeistään klo 13.00!) ovat:
     
    Harjoitus
    Palautus viim
    1 19.1.
    2 19.1.
    3 26.1.
    4 2.2.
    5 9.2.
    6 16.2.
    7 1.3.
    8 8.3.
    9 15.3.
    10 22.3.
    11 5.4.
    12 12.4.

    Kurssin pitäjän tavoite (mutta ei lupaus) on, että uudet harjoitukset ilmestyisivät verkkoon aina edellisen viikon perjantaina, jolloin tehtävien tekemiseen olisi noin viikko aikaa.

    Laskuharjoituksista julkaistaan kurssin Mycourses-sivuilla ratkaisuehdotukset kunkin harjoituskerran jälkeen — harjoitussessioihin osallistuminen ei siis ole välttämätöntä mallien näkemiseksi. Huomaa kuitenkin, että tehtävien ratkaisuehdotukset eivät ole mikään kaikenkattava lista mahdollisia tehtävien ratkaisutapoja —monesti on paljon enemmän kuin vain yksi oikea tapa ratkaista (ohjelmointi-)tehtävä. Mikäli oletkin epävarma oman ratkaisusi kuranttiudesta, etkä pääse laskuharjoitussessioihin, voit kysellä kurssinpitäjältä myös luentojen yhteydessä edellisistä laskuharjoituksista.

    Myöhästyneitä tehtäväpalautuksia yleisesti ottaen ei arvostella. Kuitenkin, vakavamman sairastumisen tai muun akuutin hätätapauksen sattuessa olethan yhteydessä kurssin luennoitsijaan mahdollisimman aikaisin.

    Laskuharjoitustehtävät arvostellaan varsin lempeästi, periaatteella 
    • 0p = ei ratkaisua / kopioitu suunnilleen pelkkä tehtävänanto
    • 1p = oikeansuuntaista ajatusta löytyy, mutta maaliin ei ihan ole päästy
    • 2p = ratkaisu on oikein tai lähes oikein
    Kannattaa siis yrittää parhaansa eikä virheitä ole syytä pelätä!

    Kysymyksiä ja ongelmia
    Kurssin yleisiin asioihin liittyviä kysymyksiä ja ongelmia kannattaa selvittää ensisijaisesti kurssin yleisiä keskusteluryhmiä käyttäen (kts Zulip alla). Henkilökohtaisesti (maililla) lähetetyt kysymykset, jotka saattavat olla kiinnostavia myös muille opiskelijoille ohjataan pääsääntöisesti keskusteluryhmiin. Muussa tapauksessa yleisiä asioita voi kysellä suoraan opettajalta - mieluiten livenä opettajalta live-sessioiden yhteydessä. 

    Kurssin sisällöllisiin asiohin liittyviä ongelmia ja kysymyksiä kannattaa koittaa selvittää pääsääntöisesti live-sessioiden yhteydessä. Myös erillisiä tapaamisia on mahdollista sopia. Perustieteiden korkeakoulun Matematiikan ja systeemianalyysin laitoksen ylläpitämä laskutupa on käytössä myös kauppakorkeakoulun opiskelijoille.

    Kurssin Zulip-keskustelualue tarjoaa erinomaisen kysymys-vastauskanavan kurssin aiheisiin — myös ja erityisesti opiskelijoiden välillä. Kurssin opettaja pyrkii seuraamaan kurssin keskusteluryhmiä ja osallistumaan keskusteluihin mahdollisuuksien (esimerkiksi järkevien työaikojen) mukaan — keskusteluryhmät eivät kuitenkaan missään nimessä ole opettajan 24/7 helpdesk. Keskusteluryhmiä ei tule kuitenkaan käyttää valmiiden kurssin arvosanaan vaikuttavien tehtävien ratkaisujen kalasteluun tai jakoon eli lyhesti: ei spoilausta! Avoinna olevista (ja arvosanaan vaikuttavista) tehtävistä ei siis ole kiellettyä keskustella, mutta keskustelu pidettävä riittävän yleisellä tasolla siten, että valmiita ratkaisuja ei jaeta. Turvallisin tapa on näissä viitata aina kaikkeen aiempaan kurssimateriaaliin, harjoituksiin ja esimerkkeihin. Tarkemmat ohjeet Zulipin käyttöön ja käyttöönottoon löytyvät [täältä]. Lue myös edellisestä linkistä ohjeita postauksiin, sekä keskusteltaviin aiheisiin.


    Kurssin vastuuopettajana toimii Patrik Nummi. Yhteydenotot sähköpostitse etunimi.sukunimi@aalto.fi. Kurssikoodi / kurssin nimi ja yhteydenoton aihe viestin otsikkokenttään. Jos kurssin järjestelyissä tms. ilmenee epäselvyyksiä, ole yhteydessä.


    Suoritustapa
    Kurssi suoritetaan kurssitentillä. Kurssin kaikki tentit järjestetään kampuksella, ja ne ovat sähköisiä (huom! luokkatentti - ei ns EXAM-tentti). Tenttijärjestelyjen erikoistarpeesta (lisäaika yms.) on hyvä olla tenttikansliaan yhteydessä jo hyvissä ajoin. (Varauduthan esittämään Aalto yliopiston opiskelijapalveluiden tms. myöntämän todistuksen / selvityksen josta oikeus erityisjärjestelyihin selviää.)

    Kurssitentissä sallitut apuvälineet ovat kynä, pyyhekumi, RStudio, sekä talon puolesta tarjottu kaavakokoelma, joka löytyy kurssin MyCourses-alustalta (lisätään myöhemmin).

    Arviointiperusteet
    Kurssin arvosanaan on mahdollista vaikuttaa tekemällä aktiivisesti kotitehtäviä. Kurssin arvosana määräytyy joko suoraan tentistä tai kombinaatiosta tentti + laskuharjoituspisteet, kumpi opiskelijalle on suotuisampi. Tarkemmin, parempi seuraavasta kahdesta jää voimaan:
    1. Kurssitentistä saadut pisteet (100% kokonaispisteistä)
    2. Kurssitentistä saadut pisteet (60% kokonaispisteistä) sekä laskuharjoituksista saadut pisteet (40% kokonaispisteistä).

    Arvostelu:

    Kurssin läpäisemiseen vaaditaan vähintään puolet tentin maksimipisteistä. Sinun on siis saatava puolet kurssitentin maksimipisteistä riippumatta siitä, paljonko olet tehnyt laskuharjoituksia. Arvosanat määräytyvät (alustavasti) seuraavasti:

    • 50% - 59% kokonaispisteistä: arvosana 1
    • 60% - 69% kokonaispisteistä: arvosana 2
    • 70% - 79% kokonaispisteistä: arvosana 3
    • 80% - 89% kokonaispisteistä: arvosana 4
    • 90% - 100% kokonaispisteistä: arvosana 5