732G16 Databaser: design och programmering
Uppgifter
Den praktiska delen av kursen cirkulerar kring ett större projekt där man ska lagra, bearbeta och presentera information ur en databas. Ofta behöver man göra olika analyser av data med hjälp av olika tekniska verktyg (till exempel olika databashanterare eller statistikpaket), och kursen visar på hur man kan behöva konvertera data för att flytta det mellan olika programsystem. Det verktyg vi använder för denna konvertering är programspråket Java som tillåter full frihet i konvertering av data.
Projektbeskrivning
På ett universitet kan man fundera över hur det kommer sig att olika studenter är olika framgångsrika när det gäller att ta kurser. Man skulle kunna göra statistiska analyser för att undersöka ifall studenternas förkunskaper när de kommer till universitetet har någon inverkan. Man vill studera förhållandet mellan studenternas meritpoäng från gymnasiet (antagningspoäng) och hur många poäng de tar på högskolan. Givet data om studenter, antagningspoäng och kurser ska ni med hjälp av linjär regression (formeln finns i beskrivningen av den projektdelen) undersöka eventuella samband mellan antagningspoäng och tagna kurspoäng för olika urval av studenter och typer av kurser. Dels vill man veta om det är några skillnader mellan obligatoriska och valbara kurser (hypotesen är att en valbar kurs är något mer motiverande och därför bör studenter ta fler valbara poäng än obligatoriska). Dels undrar man också ifall det finns skillnader mellan de olika programmen (hypotesen är att vissa program har mer motiverade eller duktigare studenter). De grupperingar som ska användas är:
- Per program
- Per kurs
- Valbara/obligatoriska kurser
Denna praktiska del av kursen genomförs i par och ger 3.5 hp. Den beräknas alltså ta c;a 100 timmar att genomföra (per person). Endast en mindre del av denna tid är schemalagd. Utnyttja den tiden väl. Redovisning av de olika deluppgifterna nedan sker till kursledningen enligt instruktioner i de olika uppgiftsbeskrivningarna och senaste datum för inlämning finns på Examinations-sidan.
Deluppgifter
- Designa databasen
För att kunna skapa och arbeta med en databas måste man behärska ett antal steg. Först måste databasen designas på en övergripande nivå (som kallas konceptuell) utifrån de krav på informationsinnehåll och informationssökning tillämpningen i slutänden ska uppfylla. En databasdesign illustreras med ett ER-diagram. Den konceptuella beskrivningen av databasen (ER-diagrammet) måste sedan sedan konverteras till ett Relationsschema, vilket kan implementeras i MySql, den databashanterare ni ska använda. Innan schemat implementeras ska man undersöka om det är optimalt genom att normalisera det. - Behärska databasspråket SQL
För att kunna manipulera data i en relationsdatabas behöver man kunna databasspråket SQL. En inledande övning på detta genomförs mot en befintlig databas. - Implementera och fylla databasen med data
När man har ett bra databasschema ska det implementeras, dvs läggas in i en databashanterare. I ert fall används MySQL. Sedan måste man fylla databasen med data, i detta fall med hjälp av databasspråket SQL och programspråket Java. - Bearbeta data med SQL
När man har lagt in data i en databas har databashanteraren enklare funktioner för bearbetning av data. I detta steg ska ni enbart använda SQL för att göra enkla analyser och sedan välja ut lämpliga data som ska exporteras till SAS för analys. - Exportera till SAS
Använ java för att exportera data till SAS. - Beräkningar i SAS
Slutligen kan man använda SAS inbyggda funktioner för att utföra statistisk analys på data som man förberett.
Sidansvarig: infomaster
Senast uppdaterad: 2011-03-23
