Unicode
Unicode is als de tolk van het internet. Het zorgt ervoor dat computers, websites, apps en systemen wereldwijd dezelfde taal spreken als het om tekens gaat. Of je nu een é typt, een emoji invoegt of een Japans karakter verstuurt: Unicode vertaalt het naar een unieke code die overal begrepen wordt.
Inhoudsopgave
Eén code om ze allemaal te lezen
Unicode kent inmiddels meer dan 150.000 tekens en dat aantal groeit nog steeds. De standaard omvat niet alleen de letters die we dagelijks gebruiken, zoals de a, é of ç, maar ook een enorme reeks symbolen, leestekens, valuta-tekens en cijfernotaties.
Daarnaast bevat Unicode complete alfabetten uit andere talen, zoals Grieks, Arabisch, Cyrillisch, en duizenden karakters uit bijvoorbeeld het Chinees, Japans en Koreaans. Zelfs speciale tekens voor wiskunde, muzieknotatie en technische symbolen hebben hun eigen plek. Kortom: alles wat digitaal leesbaar moet zijn, krijgt een unieke code.
Elk teken krijgt een unieke code (bijvoorbeeld U+00E9 voor “é”). Die code is overal hetzelfde, ongeacht besturingssysteem, browser of apparaat. Handig, want zo voorkom je rare tekens of weergavefouten op je website of in e-mails.
De stille held achter je scherm
Unicode klinkt misschien technisch, maar het raakt iedereen die online werkt, content maakt of met meerdere talen of systemen te maken heeft. Zonder dat je het merkt, zorgt Unicode ervoor dat tekens correct worden opgeslagen, weergegeven en begrepen (in browsers, e-mails, apps en websites). En dat maakt het relevant voor veel meer situaties dan je misschien denkt. Denk bijvoorbeeld aan:
- Meertalige websites die foutloos teksten willen tonen
- Internationale webshops die valuta en namen correct willen weergeven
- Developers die willen dat hun code overal klopt
- Marketeers die emoji’s gebruiken in campagnes of nieuwsbrieven
- Contentteams die met vertalingen werken of externe scripts gebruiken
Zonder Unicode zouden veel tekens niet goed doorkomen en dat betekent verwarring, gebroken teksten of onprofessionele indrukken. Zeker in een tijd waarin internationale communicatie de norm is, is Unicode een stille kracht die alles draaiende houdt.
Hoe Unicode alles samenbrengt
Vóór Unicode waren er allerlei coderingen, zoals ASCII of ISO-8859. Die werkten prima binnen één taal of regio, maar liepen vast zodra je iets buiten je eigen bubbel ging doen. Unicode is ontworpen als universele oplossing en heeft die rol inmiddels wereldwijd overgenomen.
Tegenwoordig zie je vaak termen als UTF-8 of UTF-16. Dat zijn verschillende manieren om Unicode-tekens op te slaan of te verzenden, maar ze maken allemaal gebruik van dezelfde tekentabel. UTF-8 is veruit de populairste, zeker op het web.
Veelgestelde vragen
Unicode is de tekentabel. UTF-8 is een manier om die tekens op te slaan of te verzenden. Denk: het verschil tussen woorden (Unicode) en het bestandsformaat waarin je ze opslaat (UTF-8).
Ja, meestal geef je in de HTML aan dat je UTF-8 gebruikt. Dat voorkomt weergavefouten. In de <head> van je pagina zet je dan: <meta charset=”UTF-8″>.
Dat komt vaak door een mismatch tussen de gebruikte tekenset en hoe de browser die interpreteert. Unicode (via UTF-8) lost dat meestal op.
Zeker! Emoji’s zijn officieel onderdeel van Unicode. Elk jaar worden er nieuwe toegevoegd. Elke emoji heeft een eigen Unicode-code.