Göm menyn

729G09 Språkvetenskaplig databehandling

Övningar Lab 2


 

Övningar inför Laboration 2

Syftet med dessa övningar är att du ska bekanta dig med de funktioner som används i Laboration 2 och komma underfund med hur man kan använda dem för att arbeta med tabulerade data.

Inga uppgifter behöver redovisas, men fråga någon handledare om du stöter på problem.

De verktyg som används är följande:

 • cut, paste, sort och uniq - extrahera textkolumner, räkna frekvenser och sortera.
 • grep - verktyg för att söka i text med reguljära uttryck
 • sed - verktyg för att utföra "sök och ersätt" i text
 • tr - verktyg för att byta ut tecken mot varandra t.ex. ändra alla stora bokstäver till små bokstäver.
 • Skript i Unix en kort introduktion till hur man skriver skript.

Material om du känner dig osäker på att arbeta i Unix-miljö och vill se grundläggande Unix-kommandon:

Data

För övningarna används en fil där fingerade studenter med fingerade personnummer är listade med fingerade resultat på två tentor. Filen finns här. Börja med att kopiera den till din egen katalog.

Strukturen på en rad i filen är följande:

 1. Ett namn med två eller fler delar
 2. En tab (\t)
 3. Ett personnummer
 4. En tab (\t)
 5. Två siffror separerade med ett mellanslag

Övningar

 1. Använd funktionerna cut och paste för att
  1. plocka ut alla namn
  2. plocka ut alla personnummer
  3. plocka ut namn + resultat på det första provet
  4. plocka ut personnummer + resultat på det andra provet
  5. plocka ut en lista med efternamn
  6. skriva om listan med personnumret först och sedan namnen
 2. Skapa en fil med fingerade provresultat, ett för varje student, och för in den med paste efter de andra resultaten med ett mellanslag emellan.
 3. Använd sort för att
  1. göra listan sorterad alfabetiskt efter förnamn
  2. göra listan sorterad efter efternamn
  3. göra listan sorterad efter födelsedatum
  4. göra listan sorterad efter resultat på första provet
 4. Använd grep för att
  1. plocka ut personer vars förnamn eller efternamn börjar på M
  2. plocka ut de personer vars efternamn börjar på M
  3. plocka ut de personer som är födda 1991
 5. Använd tr eller substitutionsoperatorn s i sed för att byta ut alla stora bokstäver mot små.
 6. Använd cut, sort och uniq -c för att beräkna frekvenserna för resultatpoängen på det andra provet.

 7. Sidansvarig: Lars Ahrenberg
  Senast uppdaterad: 2014-04-09