TDAB01 Sannolikhetslära och statistik
Kursinformation
Kurslitteratur
Probability and Statistics for Computer Scientists av Michael Baron, CRC Press, 2:a eller 3:e upplagan.Slides.
Kursens struktur
Kursmaterialet presenteras på föreläsningar. Rekommenderade övningar där man kan öva på kursmaterialet på egen hand listas. Lektionerna används för att räkna på de mest representativa rekommenderade övningar i detalj. Datorlaborationerna ger fördjupad förståelse av sannolikhetslära och statistik genom praktisk implementering via dator.Sannolikhetslära
Föreläsning 1: Introduktion. Sannolikhetsbegreppet. Matematiska sannolikheter. Betingade sannolikheter. Bayes sats.Läs: Baron Kap. 1-2. | Slides
Rekommenderade övningar: 2.1, 2.3, 2.4, 2.5, 2.6, 2.7, 2.8, 2.11, 2.14, 2.16, 2.17, 2.32/2.33 | Facit
Lektion 1: 2.1, 2.4, 2.8, 2.16, 2.32/2.33 (dvs. 2.32 i 2:a upplagan och 2.33 i 3:e upplagan).
Föreläsning 2: Diskreta slumpvariabler. Sannolikhetsfördelning. Simultanfördelning. Marginalfördelning. Väntevärde. Varians.
Läs: Baron Kap. 3.1-3.3 (ej 3.3.8). | Slides
Rekommenderade övningar: 3.1, 3.2, 3.4, 3.8, 3.9, 3.10, 3.11, 3.12, 3.13, 3.16, 3.19 | Facit
Lektion 2: 3.1, 3.2, 3.11, 3.12, 3.19.
Föreläsning 3: Fördelningsfamiljer för diskreta variabler. Bernoulli. Binomial. Multinomial. Geometrisk. Negativ binomial. Poisson.
Läs: Baron Kap. 3.4. | Slides
Rekommenderade övningar: 3.5, 3.20, 3.21, 3.23, 3.24, 3.25, 3.27/3.28, 3.28/3.29, 3.29/3.30, 3.30/3.31, 3.31/3.32, 3.35/3.36, 3.37/3.38 | Facit
Lektion 3: 3.24, 3.28/3.29, 3.29/3.30, 3.30/3.31, 3.37/3.38.
Kod: ManipDistributions.R
Föreläsning 4: Kontinuerliga slumpvariabler. Fördelningsfamiljer för kont. variabler. Likformig. Exponential. Gamma. Beta. Normal. Student t.
Läs: Baron Kap. 4 (ej 4.3), s. 407 och 410 i 2:a upplagan, och s. 422 och 424 i 3:e upplagan. | Slides
Rekommenderade övningar: 4.2, 4.6, 4.7, 4.8, 4.9, 4.10, 4.11, 4.14, 4.16, 4.17, 4.19, 4.29/4.31, 4.30/4.32, 4.32/4.34 | Facit
Lektion 4: 4.2, 4.7, 4.11, 4.14, 4.30/4.32.
Extra material: Applet för att lära sig om t-fördelningen.
Föreläsning 5: Stora talens lag. Centrala gränsvärdessatsen. Simulering och Monte Carlo metoder.
Läs: Baron Kap. 4.3, 5.1, 5.2.1-5.2.3, 5.3.1-5.3.2. | Slides
Rekommenderade övningar: 4.23, 4.24, 4.25, 4.26, 4.27, 4.28/4.30, 4.31/4.33, 5.1, 5.2, 5.6 | Facit
Lektion 5: 4.24, 4.25, 4.31/4.33, 5.1, 5.6.
Föreläsning 6: Markovkedjor. Binomialprocess. Poissonprocess.
Läs: Baron Kap. 6.1-6.3. | Slides
Rekommenderade övningar: 6.1 (a,b,c), 6.3, 6.9, 6.12, 6.14, 6.17, 6.18, 6.19, 6.20, 6.21, 6.22, 6.23, 6.24 | Facit
Lektion 6: 6.1 (a,c), 6.9, 6.18, 6.22, 6.23.
Kod: SimulateMarkovChain.R | SimulateBinomialProcess.R | SimulatePoissonProcess.R
Statistik
Föreläsning 7: Population. Stickprov. Parametrar. Deskriptiv statistik. Grafisk statistik.Läs: Baron Kap. 8 (ej 8.2.6, 8.3.2, 8.3.3). | Slides
Rekommenderade övningar: 8.1 (b), 8.2 (a,b), 8.3, 8.4, 8.5, 8.6, 8.7 (a,b), 8.9 | Facit
Lektion 7: 8.4, 8.5, 8.6, 8.7 (a,b), 8.9.
Kod: SS7GraferDemo.R
Extra material: Enkla grafer i R | Intro till mer avancerade grafer med R-paketet ggplot2.
Föreläsning 8: Punktskattning. Likelihood. Maximum likelihood. Samplingfördelning. Väntevärdesriktighet. Konfidensintervall.
Läs: Baron Kap. 9.1 (ej 9.1.1), 9.2.1, 9.2.2, 9.3.1, 9.3.2, 9.3.4. | Slides
Rekommenderade övningar: 9.1, 9.2, 9.3, 9.4. Använd bara ML metoden | Facit
Lektion 8: 9.1, 9.3, 9.4. Använd bara ML metoden.
Extra material: Applet för att lära sig om konfidensintervall.
Föreläsning 9: Hypotestest. P-värde. Chi2-test.
Läs: Baron Kap. 9.4.1-9.4.6, 9.4.8, 9.4.10, 9.5.1-9.5.3. | Slides
Rekommenderade övningar: 9.7, 9.8, 9.9, 9.10, 9.12, 9.13, 9.16, 9.17 | Facit
Lektion 9: 9.7, 9.8, 9.9, 9.10, 9.16.
Extra material: Applet för att lära sig om hypotestest.
Föreläsning 10: Bayesiansk inferens.
Läs: Baron Kap. 10.4 + Kompendium om Bayesiansk inferens | Slides
Kod: Binomial-Beta | Normal-Normal | Multinomial-Dirichlet
Rekommenderade övningar: 10.31, 10.32, 10.33, 10.34, 10.35, 10.36, 10.37, 10.39, 10.40 | Facit
Lektion 10: 10.32, 10.33, 10.34, 10.35, 10.40.
Föreläsning 11: Regression.
Läs: 11.1, 11.3.1-11.3.2. | Slides
Rekommenderade övningar: 11.1, 11.2 (a), 11.3 (a), 11.5 (a) 11.8 (a,b), 11.10 (a,c), 11.11 (a,b), 11.12 (a,b,d) | Facit
Lektion 11: 11.2 (a), 11.3 (a), 11.5 (a), 11.8 (a,b), 11.12 (a,b,d).
Extra material: R Manipulate för att förstå minsta kvadrat skattningar | fraudDetect.R tillämpar logistisk regression för att upptäcka förfalskade sedlar.
Föreläsning 12: Prediktion.
Läs: 11.2 | Slides
Rekommenderade övningar: 11.2 (c), 11.3 (b,c), 11.4 (b,c,d), 11.5 (b,c) | Facit
Lektion 12: 11.2 (c), 11.3 (b,c), 11.4 (b,c,d), 11.5 (b,c).
Datorlaborationer
Laborationerna ska göras två och två. Rapporterna skickas in via LISAM. Se LISAM för den sista inlämningsdagen för varje labb.Datorlaboration 1: Simulering. Labb
Datorlaboration 2: Estimatorer och deras samplingegenskaper. Labb
Datorlaboration 3: Bayesiansk inferens. Labb
Annat kursmaterial
- Tabell och formelsamling.
- R är ett programmeringsspråk som numera är de facto standard för dataanalys.
- RStudio är en riktigt trevlig IDE för det statistiska programmeringsspråket R.
Sidansvarig: Jose M. Peña
Senast uppdaterad: 2021-10-18