ISM-C1002 - Tilastotieteen ja data-analytiikan jatkokurssi, Luento-opetus, 8.1.2024-19.4.2024
This course space end date is set to 19.04.2024 Search Courses: ISM-C1002
Topic outline
-
Kurssin avaus ja ensimmäinen luento pidetään maanantaina 8.1. klo 13.15–16.00 salissa C202 (Tietotekniikan talo, T1). Kuten kurssin nimestäkin käy ilmi, data-analyyysi on kurssilla keskiössä — otathan oman läppärisi mukaan luennoille mikäli mahdollista, sillä kurssin luennoilla tehdään paljon aktivoivia harjoituksia (kts. kohdat "Kurssiaikataulu" ja "Luennoista" alla).
Kurssin tavoite
Kurssi on nimensä mukaisesti jatkokurssi aiemmille peruskursseille, jossa toisaalta opiskellaan lisää teoreettista pohjaa sekä tehdään paljon käytännön tilastollisia sovelluksia. Kurssin tavoitteena on tarjota hyviä valmiuksia myöhempiä menetelmätieteiden opintoja varten sekä muun muassa mahdollista kandityötä varten.
Kurssin sisältö
Kurssilla opiskellaan sekä teoriaa että käytäntöä, ja käytäntöä toteutetaan erityisesti R-ohjelmistolla. Sisältöön kuuluu peruskursseja vaativampaa matemaattisia sisältöä, mutta tätä ei kuitenkaan tarvitse pelästyä - hyvällä perustason lukiomatematiikalla ja hyvällä opiskeluasenteella tästä selvitään aivan varmasti. Kurssin matematiikka kurssilla on työvälineluontoista — ei kurssin pääfokus. Kurssin aikana tehdään paljon käytännön soveltavia tilastoanalyysejä R-kieltä käyttäen ja R:ään tutustuminen on yksi kurssin oppimistavoitteita. R:ää opiskellaan sekä teknisestä näkökulmasta että hyvien ja järkevien työskentelytapojen näkökulmasta. Kurssi ei kuitenkaan ole varsinainen puhdas kaikenkattava R-kurssi, vaan R on enemmänkin kurssin työväline - joskin tätä kautta R:ään hyvän pohjan, jonka päälle pystyy hyvin rakentamaan lisäosaamista.
Esitietovaatimukset
Kurssilla oletetaan tunnetuksi kurssien Tilastotieteen perusteet (30A02000) sekä Taulukkolaskenta ja analytikka / Johdatus Data-analytiikkaan sisällöt tai siihen verrattavat asiakokonaisuudet. Erityisesti oletetaan hyvät pohjatiedot kurssilta Tilastotieteen perusteet tai muut vastaavat tiedot. Hyvä arvosana em. kurssilta ei kuitenkaan automaattisesti tarkoita hyviä pohjatietoja ja on mahdollista, että opiskelija joutuu kertaamaan näitä asioita itsenäisesti. Tällä kurssilla kertausta tilastotieteiden perusteista tehdään vain paikoitellen ja kevyesti - mahdolliset puutteet näissä aihealueissa joutuu opiskelija paikkaamaan itse ja on siis lähtökohtaisesti itse vastuussa näistä. Tähän paikkailuun voi käyttää esimerkiksi kurssin Tilastotieteen perusteet vanhaa kurssisivua.
Edellä mainitun kahden ennakkotietokurssin matemaattisen sisällön lisäksi opiskelijalta edellytetään myös vähintään lukiomatematiikan lyhyen oppimäärän hallintaa . Mikäli lukion (pitkästä) matematiikasta tai muualta on perusintegrointi tuttua, niin siitä on etua, mutta tämä ei missään nimessä ole ennakkovaatimus.Kurssin aikataulu:
- Ma klo 13.15-16.00: uuden opiskelupaketin sisällön läpikäyntiä. Tätä
sessiota varten opiskelijan tulee tutustua etukäteen itsenäisesti aiheen
teoriasisältöön. Sessiossa tehdään myös harjoituksia joko R:llä tai
kynällä-paperilla. Oma R:llä varustettu tietokone on hyvin suositeltava.
- Pe klo 13.15-15.00: harjoitustehtäväsessio, jossa käydään läpi opiskelupaketin palautettavat tehtävät sekä tarpeen mukaan täydennetään ja kerrataan opiskeltua aihepiiriä.
Katso luentojen ja laskuharjoitusten tarkempi aikataulu SISUsta!Kurssin oma laskupajaKurssilla on käytössä myös oma vapaaehtoinen laskupaja, jonne voi oman tarpeen mukaan mennä kyselemään neuvoja kyseisen viikon laskaritehtäviin (ja kurssin asioista ylipäänsä). Pajan tarkoitus on siis auttaa opiskelijaa eteenpäin oivaltamaan tehtävän ratkaisu mahdollisimman itsenäisesti, ei tarjota suoria vastauksia / ratkaisuja tehtäviin. Pajaa pitää kurssiassistentti Tommi Raita.Laskupajan aikataulu Viikko Pvm Klo Luokkatila 09 Ti 27.02.2024 15:15-17:00 A136 T6 Ke 28.02.2024 13:15-15:00 U406a 10 Ti 05.03.2024 15:15-17:00 A136 T6 Ke 06.03.2024 13:15-15:00 U406a 11 Ti 12.03.2024 15:15-17:00 A136 T6 Ke 13.03.2024 13:15-15:00 U406a 12 Ti 19.03.2024 15:15-17:00 A136 T6 Ke 20.03.2024 13:15-15:00 U406a 13 Ti 26.03.2024 15:15-17:00 A136 T6 Ke 27.03.2024 13:15-15:00 U406a 15 Ti 09.04.2024 15:15-17:00 A136 T6 Ke 10.04.2024 13:15-15:00 U406a - Luokka U406a sijaitsee osoitteessa Otakaari 1 (Kandidaattikeskus),
- Luokka A136 T6 sijaitsee osoitteessa Konemiehentie 2 (Tietotekniikan talo).
Osallistumalla säännöllisesti live-sessioihin- Kurssin sisältö ja merkitys näyttäytyy paljon antoisammalta ja relevantimmalta
- Takaa huomattavasti paremman sisällöllisen osaamisen ja ymmärryksen
- Takaa usein paremman kurssiarvosanan ja usein vieläpä vähemmällä työllä ja stressillä (win-win)
Erityisesti kannattaa huomata, että kurssin sisältöön kuuluu peruskursseja enemmän esimerkiksi asioiden merkitysten ja yhteyksien rakentamista, erilaisten käytäntöjen pohdintaa sekä työtapa-asioita. Näitä käydään läpi ainoastaan live-sessioissa. Kurssilla ei ole pakollisia läsnäoloja ja kurssia on siis periaatteessa mahdollista suorittaa myös ilman säännöllistä osallistumista live-sessioihin. Kannattaa kuitenkin huomata, että kurssi on huomattavasti hankalampi täysin itsenäisesti opiskellen — ja täysin itseopiskeltavaksi selkeästi hankalampi kuin esimerkiksi kurssi Tilastotieteen perusteet.Kurssitentti
Pe 19.4. klo 13.00-16.00 (useita saleja, tiedotetaan myöhemmin)KurssiaikatauluAlustava kurssiaikataulu on seuraavanlainen (päivittyy kurssin edetessä, viimeisin päivitys 5.4.):
Vko Aihe Perehdy ennakkoon 1 M0. Johdanto. R-softan käytön harjoittelua. Tee Alkukysely. Jos mahdollista, asenna R ja RStudio (ohjeet lohkossa R-materiaalia: R-ohjelmointikielen ja RStudion asentaminen sekä RStudion käyttö) 2 M1. Jatkuvat ja diskreetit jakaumat, tiheysfunktiot. Lisää R-softan perusasioita (R Markdown ja LaTeX). Lue M1. Ennakko osat 1–2 (lukiomatematiikan kertausta / täydennystä) ja M1 Teoriamateriaali, sivut 1–5. Katso videot R Koulu: R Markdown 1–3 (lohkosta R-materiaalia: R Markdown-ohjeita) 3 M1. Jatkuvat ja diskreetit jakaumat, tunnusluvut. Lue M1: Teoriamateriaali, sivut 6–10 (kertaa tarvittaessa Tilastotieteen peruskurssin "Satunnaismuuttujat ja jakaumat" -kalvot 20-48). Katso videot R-Koulu 6-8. 4 M1. Muutamia yleisiä "testijakaumia": esim F-jakauma, khii-toiseen-jakauma Lue M1: Teoriamateriaali, sivut 11–17. Katso video R-Koulu 10: Loopit eli silmukat + apply. 5 M2. Eksponentiaalinen jakauma, Gamma-jakauma, Poisson-jakauma: tunnuslukuja ja sovelluksia Lue M2: Teoriamateriaali, sivut 1–9. Katso video R-koulu 11: Omat funktiot. 6 M3. Moniulotteisia jakaumia: yhteisjakauma, kertymäfunktio, tiheysfunktio. Moniulotteinen Gaussinen jakauma Vilkaise ensin moniulotteisista integraaleista tämä ja etenkin tämä (huom! Esimerkki 1 (c)-(e) ja Esimerkki 2 eivät kuulu kurssin vaatimuksiin) - noteeraa erityisesti Esimerkki 1 (a) ja (b) sekä Fubinin lause (Fubini's theorem). Lue M3: Teoriamateriaali, sivut 1–6 (pl. "Satunnaismuuttujien riippuvuus tai riippumattomuus", "Multinomijakauma") Väliviikko 19.2.–25.2. 7 M3. Lisää moniulotteisista jakaumista: reunajakaumat, ehdolliset jakaumat, tunnuslukujen laskemista Lue M3: Teoriamateriaali, sivut 7–15 , "Satunnaismuuttujien riippuvuus tai riippumattomuus" s. 1–2, lue R-tutuksi luku 4.2. 8 M4. Testejä, osa I. Hypoteesitestausta (parametrinen tapaus) Lue M4: Teoriamateriaali, sivut 1–4 9 M5. Testejä, osa II. Ei-parametrisiä testejä Lue M5: Teoriamateriaali, sivut 1–11 10 M6. Lineaarinen regressio, monen muuttujan lineaarinen regressio Lue M6: Teoriamateriaali, sivut 1–9 11 M6. Lisää usean muuttujan lineaarista regressiota Lue M6: Teoriamateriaali, sivut 10–14, lue R-tutuksi luku 6.3: If else-rakenne Väliviikko 28.3.–3.4. 12 M7. Uskottavuuspäättely. Logistinen regressio. Poisson-regressio. Lue M7: Teoriamateriaali, sivut 5–10 Luennoista
Kurssin luennot eivät ole perinteisiä "yksi puhuu - muut kuuntelee" -monologeja, vaan kurssilla on käytössä ns. blended teaching-menetelmä. Idea on että opiskelijat tutustuvat kunkin viikon teeman kurssimateriaaliin (kts. kohta kurssimateriaali alla) etukäteen ennen luentoa, ja luennoilla keskitytään asioiden syventämiseen ja soveltamiseen. Luennoilla kerrataan materiaalista korkeintaan joitakin ydinkohtia, ja pääfokus on viikkoteemaan liittyvien laskuesimerkkien läpikäyminen yksin tai pareittain, luennoitsijan antaessa tarvittavaa taustatukea. Katso tarkempi aikataulutus yllä olevasta taulukosta kohdasta "Perehdy ennakkoon" tietääksesi mitä kannattaa olla luettuna ennen mitäkin luentoa.Kurssimateriaali
Kurssimateriaalina toimivat luentodiat sekä Panu Erästön kirjoittama teoriapaketti. Nämä löytyvät alakohtiin M1-M7 ryhmiteltynä kurssisivun vasemmasta sivupalkista.Laskuharjoitukset
Kurssin laskuharjoitustehtävät koostuvat perinteisemmistä "kynä & paperi"-tehtävistä, sekä R-softalla toteutetuista tilastollisen päättelyn tehtävistä, nämä löytyvät lohkosta "Harjoitukset". Kunkin tehtäväkierroksen laskuharjoitustehtävien ratkaisut palautetaan sähköisesti yhtenä R Markdown-tiedostona (.Rmd) MyCoursesissa kullekin kierrokselle merkittyyn palautuslaatikkoon, löytyy lohkosta "Harjoitukset".Laskuharjoitustilaisuuksissa käydään läpi viikon tehtävien ratkaisuja. Huomaa, että ensimmäissä tehtävissä on jatkettu DL: palautus vasta 19.1. joka on yhteinen kakkosharjoitusten kanssa! Ensimmäinen laskuharjoitustilaisuus 12.1. käytetäänkin poikkeuksellisesti R / RStudio-tukipajana, jonne saa tulla vapaaehtoisesti ja vapaamuotoisesti kysymään apua tehtävien kanssa käyntiin pääsemisessä. Harjoitusten palautusten päivämäärät (huomaa, että palautus on aina ennen laskuharjoitustilaisuutta, eli viimeistään klo 13.00!) ovat:
Harjoitus Palautus viim 1 19.1. 2 19.1. 3 26.1. 4 2.2. 5 9.2. 6 16.2. 7 1.3. 8 8.3. 9 15.3. 10 22.3. 11 5.4. 12 12.4.
Kurssin pitäjän tavoite (mutta ei lupaus) on, että uudet harjoitukset ilmestyisivät verkkoon aina edellisen viikon perjantaina, jolloin tehtävien tekemiseen olisi noin viikko aikaa.Laskuharjoituksista julkaistaan kurssin Mycourses-sivuilla ratkaisuehdotukset kunkin harjoituskerran jälkeen — harjoitussessioihin osallistuminen ei siis ole välttämätöntä mallien näkemiseksi. Huomaa kuitenkin, että tehtävien ratkaisuehdotukset eivät ole mikään kaikenkattava lista mahdollisia tehtävien ratkaisutapoja —monesti on paljon enemmän kuin vain yksi oikea tapa ratkaista (ohjelmointi-)tehtävä. Mikäli oletkin epävarma oman ratkaisusi kuranttiudesta, etkä pääse laskuharjoitussessioihin, voit kysellä kurssinpitäjältä myös luentojen yhteydessä edellisistä laskuharjoituksista.Myöhästyneitä tehtäväpalautuksia yleisesti ottaen ei arvostella. Kuitenkin, vakavamman sairastumisen tai muun akuutin hätätapauksen sattuessa olethan yhteydessä kurssin luennoitsijaan mahdollisimman aikaisin.Laskuharjoitustehtävät arvostellaan varsin lempeästi, periaatteella- 0p = ei ratkaisua / kopioitu suunnilleen pelkkä tehtävänanto
- 1p = oikeansuuntaista ajatusta löytyy, mutta maaliin ei ihan ole päästy
- 2p = ratkaisu on oikein tai lähes oikein
Kannattaa siis yrittää parhaansa eikä virheitä ole syytä pelätä!Kysymyksiä ja ongelmia
Kurssin yleisiin asioihin liittyviä kysymyksiä ja ongelmia kannattaa selvittää ensisijaisesti kurssin yleisiä keskusteluryhmiä käyttäen (kts Zulip alla). Henkilökohtaisesti (maililla) lähetetyt kysymykset, jotka saattavat olla kiinnostavia myös muille opiskelijoille ohjataan pääsääntöisesti keskusteluryhmiin. Muussa tapauksessa yleisiä asioita voi kysellä suoraan opettajalta - mieluiten livenä opettajalta live-sessioiden yhteydessä.
Kurssin sisällöllisiin asiohin liittyviä ongelmia ja kysymyksiä kannattaa koittaa selvittää pääsääntöisesti live-sessioiden yhteydessä. Myös erillisiä tapaamisia on mahdollista sopia. Perustieteiden korkeakoulun Matematiikan ja systeemianalyysin laitoksen ylläpitämä laskutupa on käytössä myös kauppakorkeakoulun opiskelijoille.Kurssin Zulip: https://tilasto-jatko-2024.zulip.aalto.fi/Kurssin Zulip-keskustelualue tarjoaa erinomaisen kysymys-vastauskanavan kurssin aiheisiin — myös ja erityisesti opiskelijoiden välillä. Kurssin opettaja pyrkii seuraamaan kurssin keskusteluryhmiä ja osallistumaan keskusteluihin mahdollisuuksien (esimerkiksi järkevien työaikojen) mukaan — keskusteluryhmät eivät kuitenkaan missään nimessä ole opettajan 24/7 helpdesk. Keskusteluryhmiä ei tule kuitenkaan käyttää valmiiden kurssin arvosanaan vaikuttavien tehtävien ratkaisujen kalasteluun tai jakoon eli lyhesti: ei spoilausta! Avoinna olevista (ja arvosanaan vaikuttavista) tehtävistä ei siis ole kiellettyä keskustella, mutta keskustelu pidettävä riittävän yleisellä tasolla siten, että valmiita ratkaisuja ei jaeta. Turvallisin tapa on näissä viitata aina kaikkeen aiempaan kurssimateriaaliin, harjoituksiin ja esimerkkeihin. Tarkemmat ohjeet Zulipin käyttöön ja käyttöönottoon löytyvät [täältä]. Lue myös edellisestä linkistä ohjeita postauksiin, sekä keskusteltaviin aiheisiin.
Kurssin vastuuopettajana toimii Patrik Nummi. Yhteydenotot sähköpostitse etunimi.sukunimi@aalto.fi. Kurssikoodi / kurssin nimi ja yhteydenoton aihe viestin otsikkokenttään. Jos kurssin järjestelyissä tms. ilmenee epäselvyyksiä, ole yhteydessä.Suoritustapa
Kurssi suoritetaan kurssitentillä. Kurssin kaikki tentit järjestetään kampuksella, ja ne ovat sähköisiä (huom! luokkatentti - ei ns EXAM-tentti). Tenttijärjestelyjen erikoistarpeesta (lisäaika yms.) on hyvä olla tenttikansliaan yhteydessä jo hyvissä ajoin. (Varauduthan esittämään Aalto yliopiston opiskelijapalveluiden tms. myöntämän todistuksen / selvityksen josta oikeus erityisjärjestelyihin selviää.)
Kurssitentissä sallitut apuvälineet ovat kynä, pyyhekumi, RStudio, sekä talon puolesta tarjottu kaavakokoelma, joka löytyy kurssin MyCourses-alustalta (lisätään myöhemmin).Arviointiperusteet
Kurssin arvosanaan on mahdollista vaikuttaa tekemällä aktiivisesti kotitehtäviä. Kurssin arvosana määräytyy joko suoraan tentistä tai kombinaatiosta tentti + laskuharjoituspisteet, kumpi opiskelijalle on suotuisampi. Tarkemmin, parempi seuraavasta kahdesta jää voimaan:
- Kurssitentistä saadut pisteet (100% kokonaispisteistä)
- Kurssitentistä saadut pisteet (60% kokonaispisteistä) sekä laskuharjoituksista saadut pisteet (40% kokonaispisteistä).
Arvostelu:
Kurssin läpäisemiseen vaaditaan vähintään puolet tentin maksimipisteistä. Sinun on siis saatava puolet kurssitentin maksimipisteistä riippumatta siitä, paljonko olet tehnyt laskuharjoituksia. Arvosanat määräytyvät (alustavasti) seuraavasti:
- 50% - 59% kokonaispisteistä: arvosana 1
- 60% - 69% kokonaispisteistä: arvosana 2
- 70% - 79% kokonaispisteistä: arvosana 3
- 80% - 89% kokonaispisteistä: arvosana 4
- 90% - 100% kokonaispisteistä: arvosana 5
- Ma klo 13.15-16.00: uuden opiskelupaketin sisällön läpikäyntiä. Tätä
sessiota varten opiskelijan tulee tutustua etukäteen itsenäisesti aiheen
teoriasisältöön. Sessiossa tehdään myös harjoituksia joko R:llä tai
kynällä-paperilla. Oma R:llä varustettu tietokone on hyvin suositeltava.