Introduktion till SGML

Detta dokument är en introduktion till standarden SGML. Dessutom är det en introduktion till strukturgruppens arbete med SGML och gruppens designförslag för ett SGML-baserat informationsförsörjningsystem.

Dokumentet är en del av IT-rådets strukturgrupps dokumentserie. Strukturgruppens dokumentserie är beskrivande. Riktlinjer och råd i dessa dokument är inte tvingande. De skall ses som en del i det fortgående arbetet att skapa en enhetlig form och riktlinjer för IT-baserad kommunikation inom Linköpings universitet.

--> UTKAST <--

Innehåll

Introduktion

Allmänt

SGML är inte...

SGML är...

Strukturgruppens design-förslag

Mer att läsa


Introduktion

[Åter till innehållsförteckningen]

Allmänt

SGML är en internationell standard för beskrivning av dokument- eller informationsstruktur. Den antog 1986 och har numret ISO 8879-1986. Efter en långsam start, och med användning endast inom US:s försvarsindustri, nådde standarden större spridning runt 1991. Det verkliga genombrottet kom med World Wide Webs framfart och kan idag sägas vara allmängods inom IT-industrin. Alla ordbehandlings- och publiceringssystem för produktionsändamål har något slags stöd för SGML.

SGML har några nyckelfördelar framför andra informationsbeskrivningsstandarder (både ad hoc och planerade). SGML är generellt och utvecklingen av själva standarden styrs inte av ett eller ett fåtal företag.

[Åter till innehållsförteckningen]

Vad är SGML?

Ett enkelt men inte helt tillfredställande sätt att beskriva SGML är att räkna upp ett antal fördomar om SGML och ge argument för deras missupppfattning. I denna introduktion till ämnet räcker detta antagligen. Dessutom följer en uppräkning av vad SGML är, ett antal fördelar.

SGML är inte...

SGML är en standard som beskriver hur alla tänkbara dokument måste se ut!

SGML kräver nya ordbehandlare och verktyg, det blir en dyr affär!

SGML hanterar bara text och det finns ingen layout-kontroll!

Detta är en vanlig invändning mot SGML. Den är egentligen tudelad: multimediahantering samt presentationsform.

SGML är generellt. Själva dokumentstrukturen beskrivs enbart med text. Men detta innebär inte att man begränsas till textinformation. Tvärt om, genom att SGML är generellt innebär detta att alla existerande former av information idag kan beskrivas med SGML. Den begränsande faktorn är inte beskrivningsmodellen utan presentationsmediat; exempelvis bildskärmen eller papperet.

I SGML skiljer man på form och innehåll. Detta gör att man för varje dokument kan välja en form som passar mediet. Detta dokument skriver jag med hjälp av SGML-verktyget (och därigenom HTML-verktyget) HoTMetaL PRO. Till dokumentet har jag specificerat en form, eller style sheet som det kallas i detta program. När jag vill skriva ut på skrivare har jag nämligen andra krav än när jag vill presentera denna information via www på en bildskärm.

Jag kan lika gärna använda RTF/LaTeX/PostScript/HTML istället för SGML!

Ett sådant påstående är att jämföra äpplen och päron.

[Åter till innehållsförteckningen]

SGML är...

Ett generellt språk för att beskriva informationsstrukturer.

hierarkiska modeller

[Åter till innehållsförteckningen]

Strukturgruppens design-förslag

Strukturgruppen har under hösten undersökt möjligheten att använda SGML som den "minsta gemensamma nämnaren" för Linköpings universitets informationsförsörjningssystem. Följande är gruppens förslag på design av ett sådant system. Under våren 1996 hoppas gruppen att kunna implementera ett demo-system som visar designens genomförbarhet.

Gruppens förslag bygger inte bara på SGML som en teknisk lösning. Det är flera andra delar i designen som är minst lika viktiga. Den fyrfaldiga design-skissen består av:

Automatiskt publiceringssystem där "intelligenta robotar" sköter publiceringen. SGML är den minsta gemensamma nämnaren när det gäller informationsbeskrivning. HTML, LaTeX, PostScript, pdf, rtf jämställs. De är presentationsformat och bör hanteras som sådana.

Mallar ger stöd och stringens vid författandet. De krävs för att material skall kunna delas internt och externt.

Riktlinjer ger stöd åt författarna vid val av exempelvis bildformat, specialtecken, etc

Utbildning krävs för att författaren skall inse fördelarna med publiceringsstrategin. Dessutom för att ge författaren handlingsberedskap att utnyttja mallar och riktlinjer på ett rätt sätt.

Skapa, lagra och presentera

Detta är en skiss på det föreslagna systemet för publicering.

En lösning på problemetŠ

Ett konverterinsgfilter per översättning. Detta blir snabbt ohållbart, då antalet filter kommer att vara x*y, där x är antalet "in"-format och y antalet "ut"-format.

En SGML-lösning på problemet

Ett konverterinsgfilter per "in"-format och ett per "ut"-format. Detta handlar således om ett mer hanterligt antal filter. Antalet blir x+y, där x är antalet "in"-format och y antalet "ut"-format.

Problem med SGML-lösningen

Information utan en standard. Detta är framförallt ett problem för hanteringen av tabeller och ekvationer. Riktlinjerna måste styra i dessa fall. I vissa fall måste riktlinjerna följas till punkt och pricka som i detta fall.

[Åter till innehållsförteckningen]

Mer att läsa

En utmärkt introduktion till SGML finns A Gentle Introduction to SGML som är kapitel 2 i TEI-standarden.

[Åter till innehållsförteckningen]


Detta dokument är skrivet av Andreas Björklind. Senast ändrat 1996-04-18, validerat med hjälp av HoTMetaL Pro version 2.0 för Macintosh.