Detta dokument är en introduktion till standarden SGML. Dessutom är det en introduktion till strukturgruppens arbete med SGML och gruppens designförslag för ett SGML-baserat informationsförsörjningsystem.
Dokumentet är en del av IT-rådets strukturgrupps dokumentserie. Strukturgruppens dokumentserie är beskrivande. Riktlinjer och råd i dessa dokument är inte tvingande. De skall ses som en del i det fortgående arbetet att skapa en enhetlig form och riktlinjer för IT-baserad kommunikation inom Linköpings universitet.
--> UTKAST <--
Strukturgruppens design-förslag
[Åter till innehållsförteckningen]
SGML är en internationell standard för beskrivning av dokument- eller informationsstruktur. Den antog 1986 och har numret ISO 8879-1986. Efter en långsam start, och med användning endast inom US:s försvarsindustri, nådde standarden större spridning runt 1991. Det verkliga genombrottet kom med World Wide Webs framfart och kan idag sägas vara allmängods inom IT-industrin. Alla ordbehandlings- och publiceringssystem för produktionsändamål har något slags stöd för SGML.
SGML har några nyckelfördelar framför andra informationsbeskrivningsstandarder (både ad hoc och planerade). SGML är generellt och utvecklingen av själva standarden styrs inte av ett eller ett fåtal företag.
[Åter till innehållsförteckningen]
Ett enkelt men inte helt tillfredställande sätt att beskriva SGML är att räkna upp ett antal fördomar om SGML och ge argument för deras missupppfattning. I denna introduktion till ämnet räcker detta antagligen. Dessutom följer en uppräkning av vad SGML är, ett antal fördelar.
Detta är en vanlig invändning mot SGML. Den är egentligen tudelad: multimediahantering samt presentationsform.
SGML är generellt. Själva dokumentstrukturen beskrivs enbart med text. Men detta innebär inte att man begränsas till textinformation. Tvärt om, genom att SGML är generellt innebär detta att alla existerande former av information idag kan beskrivas med SGML. Den begränsande faktorn är inte beskrivningsmodellen utan presentationsmediat; exempelvis bildskärmen eller papperet.
I SGML skiljer man på form och innehåll. Detta gör att man för varje dokument kan välja en form som passar mediet. Detta dokument skriver jag med hjälp av SGML-verktyget (och därigenom HTML-verktyget) HoTMetaL PRO. Till dokumentet har jag specificerat en form, eller style sheet som det kallas i detta program. När jag vill skriva ut på skrivare har jag nämligen andra krav än när jag vill presentera denna information via www på en bildskärm.
Ett sådant påstående är att jämföra äpplen och päron.
[Åter till innehållsförteckningen]
hierarkiska modeller
[Åter till innehållsförteckningen]
Strukturgruppen har under hösten undersökt möjligheten att använda SGML som den "minsta gemensamma nämnaren" för Linköpings universitets informationsförsörjningssystem. Följande är gruppens förslag på design av ett sådant system. Under våren 1996 hoppas gruppen att kunna implementera ett demo-system som visar designens genomförbarhet.
Gruppens förslag bygger inte bara på SGML som en teknisk lösning. Det är flera andra delar i designen som är minst lika viktiga. Den fyrfaldiga design-skissen består av:
Automatiskt publiceringssystem där "intelligenta robotar" sköter publiceringen. SGML är den minsta gemensamma nämnaren när det gäller informationsbeskrivning. HTML, LaTeX, PostScript, pdf, rtf jämställs. De är presentationsformat och bör hanteras som sådana.
Mallar ger stöd och stringens vid författandet. De krävs för att material skall kunna delas internt och externt.
Riktlinjer ger stöd åt författarna vid val av exempelvis bildformat, specialtecken, etc
Utbildning krävs för att författaren skall inse fördelarna med publiceringsstrategin. Dessutom för att ge författaren handlingsberedskap att utnyttja mallar och riktlinjer på ett rätt sätt.
Detta är en skiss på det föreslagna systemet för publicering.
Ett konverterinsgfilter per översättning. Detta blir snabbt ohållbart,
då antalet filter kommer att vara x*y
, där x
är antalet "in"-format och y
antalet "ut"-format.
Ett konverterinsgfilter per "in"-format och ett per "ut"-format.
Detta handlar således om ett mer hanterligt antal filter. Antalet blir
x+y
, där x
är antalet "in"-format
och y
antalet "ut"-format.
Information utan en standard. Detta är framförallt ett problem för hanteringen av tabeller och ekvationer. Riktlinjerna måste styra i dessa fall. I vissa fall måste riktlinjerna följas till punkt och pricka som i detta fall.
[Åter till innehållsförteckningen]
En utmärkt introduktion till SGML finns A Gentle Introduction to SGML som är kapitel 2 i TEI-standarden.
[Åter till innehållsförteckningen]
Detta dokument är skrivet av Andreas Björklind. Senast ändrat 1996-04-18, validerat med hjälp av HoTMetaL Pro version 2.0 för Macintosh.