Introduktion till markeringsspråk

Introduktion till markeringsspråk

En textmassa (ett brev, en bok) skriven i en enda följd är mycket svårläst och kan även vara oförståelig, speciellt vid långa texter. Därför brukar vi åtskilja orden med tomma utrymmen (mellanslag) och tanke- eller syftninsgändringar med en tom rad. Helt oberoende av vilka medel som används för att skriva texten - för hand, på skrivmaskin eller dator - brukar vi göra den så läsbar som möjligt. Vi brukar dela upp den i stycken. Om texten är längre försöker vi lägga till rubriker så att läsaren kan åtskilja de olika delarna. Ord med speciellt innehåll som skribenten vill göra läsaren uppmärksam på betonas på olika sätt, t ex genom att skriva dem i en annan stil. Detta kallas för att vi strukturerar texten.

Hur texten struktureras beror till största delen på mediet som texten är avsedd för. En bok struktureras på ett sätt, medan en tidningsartikel eller en Webb-publikation struktureras på andra sätt.

När vi skriver för hand gör vi fysiska rörelser för att strukturera texten, vi lyfter pennan och flyttar den en bit innan vi börjar skriva igen. På så sätt "infogas" ett mellanslag. När vi skriver på elektroniskt sätt, t ex på en dator, gör vi också till synes fysiska rörelser. Vi klickar på olika tangenter eller ikoner för att infoga mellanslag eller tomma rader. Men som sagt, det är endast till synes. För till varje tangent eller ikon tillhör ett specifikt kommando. Vi talar om för datorn, eller rättare sagt den applikation vi använder för att skriva, t ex Microsofts Word, att den ska infoga ett mellanslag eller något annat.

Och datorn gör det. Allt vi kan se på skärmen är ett mellanslag. Men applikationen har gjort något helt annat. När vi har klickat på mellanslagstangenten gjorde Word en för oss osynlig markering i texten. Denna markering brukar vara ett speciellt tecken. På samma sätt markeras tomma rader, stycken, eller rubriker.

Dessa tecken skulle vara synliga om vi kunnat titta "bakom" dokumentet. (Det kunde man göra i äldre ordbehandlingsprogram. Idag, åtminstone i Word, kan vi endast se hur mellanslagen samt radslut är markerade.)

Det enda vi kan se om vi trots allt försöker titta bakom dokumentet är att det inte finns mellanslag (tomt utrymme) utan ett tecken som markerar dess infogning. I detta fall en punkt.

Enligt samma princip, dvs med hjälp av olika tecken, uppmärks dokumentets struktur. Varenda liten del som skapar innehållet och även ändringar i färg eller storlek på bokstäver markeras med ett speciellt tecken.

Uppmärkning i Word

Det kan hända att samma markeringar används av andra ordbehandlingsprogram. Om så är fallet kan dokument skrivna i det ena även läsas av det andra. Man brukar då säga att programmen och dokumenten är antingen kompatibla med varandra eller t.o.m. tillmötesgår varandra (är complient).

Kompatibla program kan, i vissa fall, fungera med varandra. Program som är complient fungerar utan problem med varandra.

Kompatibla: Antyder att produktens vissa delar får support av dess specifikation.

Tillmötesgående (complient): Antyder att produkten får support av specifikationen eller standarden. Två produkter som är compliant fungerar tillsammans.

Specifikation: Ett dokument som på ett formellt sätt beskriver något, t ex ett språk.

Använder programmet ett annat uppmärkningssätt förstår inte de olika programmen varandra och dokumentet kan inte läsas. Programmen/dokumenten är inte kompatibla med varandra eller tillmötesgående utan behöver sin egen plattform. Word-dokument behöver Word-ordbehandlingsprogram för att kunna läsas och Word Perfect-dokument behöver Word Perfect-ordbehandlingsprogram för att kunna läsas. Man säger då att dokumenten är plattformsberoende, dvs kräver var sin egen plattform, i detta fall programvara. Dokument skrivna i samma ordbehandlingsprogram, ett på en PC och ett på en MAC kan också ha kompatibilitetsproblem. I detta fall skulle dock dess plattformsberoende bero på hårdvaran och inte på programvaran.

Plattformsberoende: Kräver en viss plattform (programvara eller hårdvara) för att fungera.

Plattformsoberoende: Fungerar på alla plattformar, oberoende av program- och hårdvara.

Även textmassor som publiceras i tidskrifter uppmärks på liknande sätt. I tidningsbranschen använder man dock en annan programvara, t ex QuarkExpress. Denna har sitt eget markeringssätt för att markera och därmed strukturera texten i stycken, rubriker eller kolumner.

Samma regler gäller för textmassorna som ska publiceras på Webben. För att få ordning på textmassan måste man kunna åtskilja stycken från t ex rubriker. I likhet med Word- och QuarkExpress-dokument markeras Webb-dokument för att få en viss struktur. Även här använder man olika speciella tecken för att markera dokumentens olika delar.

Tecken måste vara speciella så att avläsaren kan lätt åtskilja dem från textmassan. Oftast används udda tecken eller en kombination av dem, sådana som sällan används i själva texten.

Tecknen och reglerna skapar även ett språk. Då språket är uppbyggt på olika markeringar kallas det för markeringsspråk.

Markeringsspråk är (nästan) som vilket annat språk som helst, med sin egen grammatik och sitt egna lexikon. Språkets syfte, uppbyggnad och gällande reglerna beskrivs i specifikationen.

Det är viktigt att följa specifikationen, dvs följa alla regler som den innehåller. För om en applikation som ska läsa av ett dokument hittar ett okänt tecken eller om de grammatiska reglerna inte följs kan den få "hicka" eller om det vill sig riktigt illa även krascha.

Markeringsspråk används för att omvandla textmassan till ett läsbart dokument; bygga upp dokumentet, strukturera det i rubriker, stycken, radbrytningar, tabeller, kolumner m.m.

Dessa strukturdelar som man använder för att bygga upp ett dokument kallas för element. Ett dokument (en bil eller tv eller vad som helst) är uppbyggt av olika element. Element (komponenter) som behövs för att skapa en bil är bl.a. hjul, ratt och kaross. Element som behövs för att skapa ett Word-dokument är bl.a. stycken, rubriker, radbrytningar. Element som behövs för att skapa ett Access-dokument är bl.a. fält.

Det är just dokumentets olika element som markeras med ett markeringsspråk.

Ett markeringsspråk: En metod / ett sätt att markera textmassan på så att dess innehåll kan struktureras på ett sätt som är både läsbart för människor (själva texten) och applikationer (marke-ringar). Texten markeras med i förhand bestämda tecken/ markeringar.

En markering / ett markord / ett märkord (markup): Ett speciellt tecken eller kombination av olika tecken som infogas i textmassan för att markera (åtskilja) dess olika delar och på så sätt strukturera den.

Strukturera : Bygga upp textmassans alla delar (element) till en logisk sammanhängande enhet.

Element: Komponenet (del) av en struktur.
Element i ett dokument: rubrik, stycke
Element i en bil: hjul, ratt

Till varje elementtyp hör ett unikt märkord. Varje förekomst av element av samma typ, t ex radbrytningar, i ett dokument markeras med ett och samma märkord. M.a.o. alla radbryt-ningar ett Word-dokument markeras med tecknet P. Vilka tecken eller markord som ska användas för att åtskilja de olika elementen samt vilka regler som gäller för elementens användning fastställs av språkets/programmets skapare, när det gällde Office var det Microsoft som utvecklade programmet.

P Radbrytning i Word-dokment
<br> Radbrytning i HTML-dokument
<br /> Radbrytning i XML-dokument

På samma sätt som det finns olika typer av ordbehandlingsdokument med var sitt markeringsspråk finns det även olika typer av Webb-dokument. Man väljer typ av dokument beroende på det markeringsspråk som används för att markera/strukturera dokumentet.

Exempel på styckeuppmärkning

Valid HTML 4.0!