Sections
 
New in Denmark Work Education Organisations Healthcare Relationships and Family Culture Society
You are here: Home Om FINFO Værktøjskasse Fremmede alfabeter Fremmede sprog på PC: Lidt historie
Document Actions
  • Send Facebook
  • Send Send
  • På dansk På dansk

Fremmede sprog på PC: Lidt historie

Det begyndte med 26 bogstaver

De mest udbredte styresystemer til computere er født i USA. Derfor kunne systemerne som udgangspunkt kun håndtere de 26 karakterer (bogstaver) i det engelske alfabet, foruden tal og simpel tegnsætning.

Indtil for ikke så længe siden brugte Pc’er fonte, der indeholdt højst 256 karakterer eller tegn. I de fleste fonte var de første 128 de såkaldte ASCII-tegn (hvor ASCII er forkortelsen for en amerikansk standard). I ASCII-tegnene indgår tegnsætning, tal og bogstaverne i det engelske alfabet (A-Z) samt $-tegn. De sidste 128 tegn er yderligere tegnsætning, valutasymboler (fx £ og ¥), æ, ø, å samt accent-bogstaver (fx á, ç, è, ñ, ô, ä, ü). Ældre engelske versioner af Windows anvendte dette tegnsæt, som også er kendt som ANSI-tegnsættet. For sprog som dansk betød det, at man i mange år måtte bruge fonte, hvor æ, ø, å var flyttet op blandt de første 128 tegn.

De fonte, man anvendte, var nemlig såkaldte 8-bitfonte, fordi systemet kun havde 8 bit til rådighed til gengivelse af hvert enkelt tegn. Det samme tegn kunne tildeles forskellige værdier i forskellige sprog. En fx græsk eller russisk tekst, der blev åbnet på en PC i et andet land, ville – uden den oprindelige græske font til stede – blive vist som et krimskrams af latinske tegn, spørgsmålstegn osv.

Det indebar en lang række praktiske ulemper for brugere i lande, hvis sprog ikke kan skrives med det meget simple engelske alfabet. Hvis man ville skrive (og udskrive) dansk æ, ø og å måtte man i mange år  håndprogrammere i tekstbehandling, printeropsætning m.m. Indtil for relativt nyligt var det i filnavne kun muligt at bruge de simple tegn. Selv for ét enkelt sprog som engelsk fandtes der ikke nogen indkodning, der rakte til alle bogstaverne, tegnsætningstegnene og de tekniske symboler i almindelig brug.

 Unicode-logo

Det forklares sådan på Unicode-hjemmesiden:

”Grundlæggende set beskæftiger computere sig udelukkende med tal. De arkiverer bogstaver og andre skrifttegn ved at tildele et tal til hvert enkelt tegn. Før Unicode blev opfundet, var der hundredvis af forskellige indkodningssystemer beregnet til at tildele disse tegn tal. Der fandtes ikke nogen indkodning, der kunne rumme nok skrifttegn: F.eks. har Den Europæiske Union brug for flere forskellige indkodninger til at dække alle sine sprog.”

”Disse indkodningssystemer kommer også i konflikt med hinanden. Det vil sige, at to forskellige indkodninger kan bruge det samme tal til to forskellige skrifttegn, eller de kan bruge forskellige tal til det samme skrifttegn. Alle computere (især servere) har behov for at kunne understøtte mange forskellige indkodninger; alligevel risikerer data altid at blive korrumperet, når de sendes mellem forskellige indkodninger eller platforme.”

Unicode med plads til 1 million tegn

Løsningen var at gå væk fra 8-bit-fontene med deres overgrænse på 256 tegn, hvor det samme tegn kan stå for forskellige bogstaver og tegn i forskellige alfabeter og i stedet gå over til et 100% entydigt system, hvor der til enkelt tegn i en hvilken som helst skrift hører én, unik værdi.

Denne standard kaldes Unicode og den bestyres af et internationalt standardiseringskonsortium. Unicode tildeler hvert enkelt skrifttegn et unikt tal, uanset hvilken platform, uanset hvilket program, uanset hvilket sprog. Unicode er beregnet til brug i hele verden og i alle IT-systemer. Unicode dækker i dag et meget stort antal skrifter og alfabeter fra hele verden, inklusive klassisk kinesisk, uddøde sprog og kunstsprog. Den seneste version 5.0.0 af Unicode omfatter 98,884 karakterer, som bruges til gengivelse af sprog.

Microsoft begyndte med Windows95 at indbygge Unicode-understøttelse i styresystemet. Windows NT4, Windows2000 og WindowsXP er baseret på Unicode, ikke på ANSI. Også Mac har efterhånden fået indbygget en vis Unicode-understøttelse, men det er endnu ikke slået igennem i Macs brugerprogrammer. Unicode beskrives sommetider som et 16-bit-system, som i grunden kun burde have plads til 65,536 tegn, men visse positioner er reserveret til at så at sige skifte til yderligere 16-bit-planer. Dermed kan Unicode potentielt håndtere over en million tegn.

Tilbage til FINFOs værktøjskasse