Göm menyn

732G34 Statistisk analys av komplexa data

 

Schema finns i timeedit

Mål

Kursen 732G34 Statistisk analys av komplexa data, 7.5 hp,  syftar till att vidga den studerandes kunskaper i analys av komplexa datamängder. Kursen består av 5 delar, som vardera studeras under cirka 2 veckor. Olika lärare kommer att ha hand om olika delar, efter sina specialintressen.

Efter avslutad kurs kommer du att

  • kunna använda kunskap om de vanligaste statistiska inferensmetoderna inom analys av longitudinella data, hierarkiska data, överlevnadsdata, trunkerade data samt spatiala data,
  • ha förmåga att bedöma vilken modell som är relevant för dessa typer av data,
  • på ett insiktsfullt sätt kunna tolka resultat av de gjorda analyserna.

Innehåll

Följande delar ingår i kursen.

  1. Hierarkiska data. Vecka 45-46. Introduktion till hierarkiska data, general linear mixed model, multilevelmodeller, intraklasskorrelation. Delmomentsansvarig Linda Wänström.
  2. Kategoriska och trunkerade data. Vecka 44-45. Kategoriska och trunkerade data: Introduktion till kategoriska och trunkerade data, modeller för oordnade och ordnade kategorier, multinomial logistisk regression, fördelningar för trunkerade data, Tobitregression. Delmomentsansvarig Bertil Wegmann.
  3. Longitudinella data. Vecka 49-50. Introduktion till longitudinella data, multilevelmodeller, kovariansstruktur, latenta tillväxtmodeller. Delmomentsansvarig Linda Wänström.
  4. Spatiala data. Vecka 47-48. Introduktion till spatiala data, spatial korrelation och beroende, modeller för spatiala data. Delmomentsansvarig Lotta Hallberg.
  5. Överlevnadsdata. Vecka 2-3. Överlevnadsdata: Introduktion till överlevnadsdata, censorerade data, överlevnadsfunktion, hazardfunktion, Kaplan-Meieranalys, Coxregression. Delmomentsansvarig Krzysztof Bartoszek.

Undervisningsformer

Förutom självständiga studier består undervisningen av föreläsningar/lektioner samt datorlaborationer. Föreläsningarna ger en översikt över kursinnehållet och tar upp centrala begrepp och metoder eller kan genomföras som lektioner, och består då av genomgång av övningsuppgifter. Datorlaborationerna illustrerar viktiga moment i kursen och lägger grund för examinationen.

Kurslitteratur

Kurslitteraturen kommer att bestå av utdrag ur böcker samt av vetenskapliga artiklar. Närmare information om litteraturen ges för respektive del.

Examination

Kursen examineras genom individuella laborationsrapporter för respektive delmoment. Varje rapport ger högst 20 poäng, varav minst 10 poäng ger G och minst 15 poäng ger VG. För betyget G på hela kursen krävs minst G på varje delmoment. För betyget VG på hela kursen krävs minst fyra VG och ett G på delmomenten.

Den som har fått U på någon (några) delmoment kan komplettera laborationsrapporten(rna) t.o.m. den 10/2 2014. Kontakta respektive lärare för att få mer specifika instruktioner. är man inte godkänd efter detta har man tillfälle att göra nya uppgifter i de delar man inte är godkänd på. Nya uppgifter kan erhållas 2:e juni och lösningar lämnas in senast 9:e juni. Det är endast möjligt att komplettera upp till betyg G.

Programvara

Det är framförallt R, SAS och SPSS som kommer att användas på kursens delmoment.
R och RStudio (rekommenderad arbetsmijö för R) är gratis och kan laddas ned här:
  • R
  • RStudio
  • An Introduction to R

  • Longitudinella data


    Litteratur



     


    Hierarkiska data


    Litteratur

     

     

     Inlämningsuppgift vid Datorlabb


    Kategoriska och trunkerade data



     

    Föreläsningsunderlagen bygger på kapitel 21 och 22 i boken "Econometric analysis", William H. Greene, 2003, samt exemplifiering av genomgångna modeller i R, skapade av "Institute for digital research and education, UCLA".

     

    Överlevnadsdata


    Detta moment ges på engelska, men det är tillåtet att skriva datorlaborationen på svenska

    Föreläsningsunderlag

    Tentamen

    heart.xls

    Rscripts

    Föreläsningsunderlag (extra: på svenska)

    Litteratur


    Spatiala data

    Information inför detta moment finns på Lisam