Göm menyn

TDAB01 Sannolikhetslära och statistik

Kursinformation




Kurslitteratur

Probability and Statistics for Computer Scientists av Michael Baron, CRC Press, 2:a upplagan. Boken kan t ex köpas här och här.
Slides
Annat material som delas ut under kursens gång.


Kursens struktur

Kursmaterialet presenteras på föreläsningar.
Lektionerna används för att räkna på övning i detalj.
Datorlaborationerna ger fördjupad förståelse av sannolikhetslära och statistik genom praktisk implementering via dator.

Tal med fet stil kommer att behandlas under lektionen.
Tal med vanliga stil är rekommenderade uppgifter.
Tal med kursiv stil är extra tal för ytterligare övning.


Sannolikhetslära

Föreläsning 1: Introduktion. Sannolikhetsbegreppet. Matematiska sannolikheter. Betingade sannolikheter. Bayes sats.
Läs: Baron Kap. 1-2. | Slides
Rekommenderade övningar: 1.5, 2.1, 2.4, 2.5, 2.7, 2.11, 2.14, 2.16, 2.17, 2.20, 2.25, 2.28, 2.30, 2.32.
Lektion 1: 2.1, 2.4, 2.14, 2.16, 2.32, Monty Halls paradox.
Kod: DigitClassification.R | handwritten digits data
Extra material: Kapitel om sannolikhetslära och statistik i The Deep Learning Textbook

Föreläsning 2: Diskreta slumpvariabler. Sannolikhetsfördelning. Simultanfördelning. Marginalfördelning. Väntevärde. Varians.
Läs: Baron Kap. 3.1-3.3 (ej 3.3.8). | Slides
Rekommenderade övningar: 3.1, 3.2, 3.4, 3.5, 3.9, 3.11, 3.12, 3.13, 3.16, 3.38.
Lektion 2: 3.2, 3.4, 3.12, 3.38, Simpsons paradox.

Föreläsning 3: Fördelningsfamiljer för diskreta variabler. Bernoulli. Binomial. Multinomial. Geometrisk. Poisson.
Läs: Baron Kap. 3.4 (ej 3.4.4 och 3.4.6). | Slides
Rekommenderade övningar: 3.22, 3.24, 3.27, 3.28, 3.29, 3.30, 3.37
Lektion 3: 3.24, 3.29, 3.30, 3.37, återbesök på St. Petersburgs paradox.
Kod: ManipDistributions.R
Extra material: Lite om potensserier

Föreläsning 4: Kontinuerliga slumpvariabler. Fördelningsfamiljer för kont. variabler. Likformig. Exponential. Gamma. Normal. Student t. Beta.
Läs: Baron Kap. 4 (ej 4.3), s. 407 och 410. | Slides
Rekommenderade övningar: 4.2, 4.5, 4.6, 4.7, 4.10, 4.11, 4.18, 4.19, 4.20, 4.23, 4.24, 4.25, 4.26, 4.27, 4.28, 4.29, 4.30, 4.31, 4.32, 4.34.
Lektion 4: 4.2, 4.10, 4.11, 4.18, 4.25, 4.34.
Extra material: Applet för att lära sig om t-fördelningen.

Föreläsning 5: Simulering och Monte Carlo metoder. Stora talens lag. Centrala gränsvärdessatsen.
Läs: Baron Kap. 4.3, 5.1, 5.2.1-5.2.3, 5.3. | Slides
Rekommenderade övningar: 5.1, 5.2, 5.6, 5.11, 5.14.
Lektion 5: 5.1, 5.6, 5.11, 5.14, Plinko spel.
Extra material: Interaktiv Shiny app för att undersöka central gränsvärdessatsen.

Föreläsning 6: Markovkedjor. Binomialprocess. Poissonprocess.
Läs: Baron Kap. 6.1, 6.2.1, 6.2.2, 6.3, 6.4. | Slides
Rekommenderade övningar:6.1, 6.5, 6.8, 6.9, 6.16, 6.17, 6.18, 6.22, 6.23, 6.25.
Lektion 6: 6.1, 6.5, 6.17, 6.18, 6.23.
Kod: SimulateMarkovChain.R | SimulateBinomialProcess.R | SimulatePoissonProcess.R


Statistik

Föreläsning 7: Population. Stickprov. Parametrar. Deskriptiv statistik. Grafisk statistik.
Läs: Baron Kap. 8 (ej 8.2.6, 8.3.2, 8.3.3). | Slides
Rekommenderade övningar: 8.7.
Lektion 7: 8.7 + av studenter önskade uppgifter.
Extra material: Enkla grafer i R | Intro till mer avancerade grafer med R-paketet ggplot2.

Föreläsning 8: Punktskattning. Likelihood. Maximum likelihood. Samplingfördelning. Väntevärdesriktighet. Konfidensintervall.
Läs: Baron Kap. 9.1, 9.2.1, 9.2.2, 9.3.1-9.3.2, 9.3.4. | Slides
Rekommenderade övningar: 9.1, 9.2, 9.3, 9.4, 9.5.
Lektion 8: 9.1, 9.2, 9.3, 9.4, 9.5.
Extra material: Applet för att lära sig om konfidensintervall.

Föreläsning 9: Hypotestest. P-värde. Chi2-test.
Läs: Baron Kap. 9.4.1-9.4.6, 9.4.8, 9.4.10, 9.5.1, 10.1.1-10.1.2. | Slides
Rekommenderade övningar: 9.7, 9.8, 9.9, 9.14, 9.15, 9.17, 9.18, 9.19, 9.21, 9.23, 10.1, 10.2.
Lektion 9: 9.7, 9.8, 9.18, 10.1, 10.2.
Extra material: Applet för att lära sig om hypotestest.

Föreläsning 10: Bayesiansk inferens.
Läs: Baron Kap. 10.4 + Kompendium om Bayesiansk inferens | Slides
Kod: Binomial-Beta | Normal-Normal | Multinomial-Dirichlet
Rekommenderade övningar: 10.33, 10.34, 10.35, 10.40.
Lektion 10: 10.33, 10.34, 10.35, 10.40.

Föreläsning 11: Regression.
Läs: 11.1, 11.3.1-11.3.2. | Slides
Rekommenderade övningar: 11.1, 11.2a, 11.3ac, 11.4a, 11.5abc, 11.10ac, 11.11abe.
Lektion 11: 11.1, 11.2a, 11.4a, 11.5abc, 11.10ac, 11.11abe.
Extra material: R Manipulate för att förstå minsta kvadrat skattningar | fraudDetect.R tillämpar logistisk regression för att upptäcka förfalskade sedlar.

Föreläsning 12: Prediktion. Beslut.
Läs: 11.2.3 | Slides | Flera slides
Rekommenderade övningar: Gamla tentor.
Lektion 12: Gamla tentor.

Föreläsning 13: Sammanfattning.
Läs: Ingenting. Sitt bara ner och se kursen passera revy.
Kod: Analys av cancerdata


Datorlaborationer

Laborationerna ska göras två och två. Rapporterna skickas in via LISAM. Se LISAM för den sista inlämningsdagen för varje labb.

Datorlaboration 1: Simulering. Labb
Datorlaboration 2: Estimatorer och deras samplingegenskaper. Labb
Datorlaboration 3: Bayesiansk inferens. Labb


Annat kursmaterial


Sidansvarig: Jose M. Peña
Senast uppdaterad: 2018-11-07