Een snelweg van woorden

De elektronische infrastructuur van het Nederlands

Marc van Oostendorp

Geschreven voor Taalschrift, 1997

Wie zorgt er voor de openbare weg als de overheid het niet doet? Bedrijven hebben groot belang bij een solide infrastructuur en ook burgers zijn erbij gebaat dat ze zonder hobbels en kuilen van Amsterdam naar Brussel kunnen rijden. Maar voor elk individu en elk bedrijf afzonderlijk zou het onderhoud van het wegennet te kostbaar zijn. Als we niet via onze overheid de handen ineengeslagen hadden, reden we nu misschien nog op modderige zandweggetjes.

Op allerlei plaatsen op de wereld wordt gebouwd aan een elektronische snelweg -- een wereldwijde infrastructuur voor persoonlijke brieven, prijsopgaven, wetsvoorstellen, zakelijk nieuws, wetenschappelijke artikelen en andere soorten informatie.

Het is al niet meer de vraag of een dergelijke wereldwijde infrastructuur er komt. De vraag is alleen welke rol het Nederlands daarin zal spelen en of een redelijk deel van alle informatie ook in onze taal beschikbaar komt. Er is een duidelijk belang voor de bedrijven: een werknemer die zijn eigen taal kan gebruiken werkt efficiënter. Maar bij een goede vertegenwoordiging van het Nederlands zijn we allemaal gebaat. Ook in de informatiemaatschappij moeten we onze eigen moedertaal kunnen blijven gebruiken. Het Nederlands mag niet ten onder gaan aan een gebrek aan daadkracht.

'Er zal heel wat bij komen kijken voordat de infrastructuur er ligt', waarschuwt Johan Van Hoorde van de Nederlandse Taalunie. 'Als we het Nederlands even aantrekkelijk en effectief willen houden als het Engels, zullen er nog wel een paar producten moeten komen.'

Bankpas

Allereerst zijn er natuurlijk de tekstverwerkers. Deze bieden de schrijver steeds meer hulp bij zijn werk: ze controleren zijn spelling en zijn zinsbouw, maar geven ook stilistische tips. Naar verwachting zullen in de nabije toekomst bijvoorbeeld gestandaardiseerde zakelijke brieven voor een belangrijk gedeelte automatisch geschreven kunnen worden. Maar dan wel in het Engels en een paar andere grote talen zoals het Frans, het Duits en misschien het Spaans. Als we willen dat het niet moeilijker wordt een zakelijk stuk te schrijven in onze eigen taal dan in een vreemde.

Een ander belangrijk taalkundige toepassing van de moderne techniek is spraakherkenning. Wie over een paar jaar geld uit een bankautomaat wil halen, heeft waarschijnlijk geen bankpasje of PIN meer nodig. 'U zegt dan tegen het kastje hoeveel u nodig heeft', legt Van Hoorde uit. 'Het ding herkent u aan uw stem, en begrijpt tegelijkertijd welk bedrag u noemt.'

Natuurlijk zullen computers die gesproken menselijke taal spreken en verstaan niet alleen banktransacties afhandelen. Ook de gezamenlijke organisaties voor openbaar vervoer in Nederland experimenteren sinds enige tijd met spraakherkenning. Als het goed is, kan de reiziger binnen een paar maanden naar een computer bellen om hem in gewoon Nederlands te vragen wat de kortste route is naar de plaats van bestemming.

Worldwide web

Vrijwel vanaf het moment dat de eerste computer gebouwd is, werd geprobeerd het apparaat van de ene taal naar de andere te laten vertalen. In het begin ging het daarbij vooral om vertalingen van het Russisch naar het Engels. Men beleefde nu eenmaal een koude oorlog.

Nu de communicatie steeds internationaler wordt, wordt het ook steeds belangrijker dat documenten uit en naar onze taal vertaald worden. Het is ondoenlijk om al dat werk door menselijke vertalers te laten produceren, en dus moeten ook hier computers uitkomst bieden. Op het World Wide Web -- het populairste deel van Internet, dat overigens niet voor niets een Engelstalige naam heeft -- zijn her en der programma's geïnstalleerd die tekst automatisch van de een in de andere taal omzetten. Een Franstalige gebruiker vraagt informatie op bij een Amerikaans bedrijf, en hoewel dat bedrijf die informatie alleen in het Engels presenteert, krijgt de Fransman een en ander toch in zijn eigen taal op zijn scherm. Voor zover bekend zijn dat soort faciliteiten er voor het Nederlands nog helemaal niet.

Nu zijn ook de vertaalsystemen die van het Engels naar het Frans vertalen, nog allesbehalve volmaakt. Minstens even belangrijk als dit soort systemen zijn daarom computerprogramma's die menselijke vertalers helpen bij hun werk. Bijvoorbeeld door desgewenst een aantal mogelijke vertalingen voor een woord te suggereren, of door kleine stukjes tekst voor te bewerken. Maar ook wat dit betreft staan de systemen die gericht zijn op het Nederlands nog in de kinderschoenen.

Buitenste schil

'Een taal zal in de nabije toekomst al die taalproducten nodig hebben om als een volwaardige taal te kunnen gelden', zegt Van Hoorde. 'Als we willen dat het Nederlands een serieuze taalpolitieke factor blijft, bijvoorbeeld binnen de Europese Unie, zullen we aan die infrastructuur moeten werken.'

Van Hoorde verdeelt de benodigde infrastructuur in drie lagen. Zaken als tekstverwerkers, spraakherkenningsprogramma's en automatische vertalers horen tot de eerste laag, de buitenste schil. Dit is eerder het terrein van de bedrijven dan van de overheid. De bedrijven zullen moeten beslissen welke elektronische producten ze op de markt brengen en welke diensten ze aanbieden. Een overheidsorganisatie als de Nederlandse Taalunie stelt zich hier terughoudend op en probeert alleen te sturen waar het nodig is.

Ruw materiaal

Voor de overheid is het veel belangrijker de binnenste twee schillen vorm te geven. Dit zijn de schillen die het ruwe materiaal leveren waarmee de producten gemaakt kunnen worden. De allerbinnenste schil wordt gevormd door een aantal zo groot mogelijke computerbestanden: elektronische woordenlijsten, databanken met geschreven en met gesproken Nederlands, vertaalwoordenboeken en bestanden met gedetailleerde grammaticale informatie.

Al die computerbestanden moeten idealiter zo worden ingericht dat ze voor zoveel mogelijk toepassingen kunnen worden ingezet. Een databank met grote hoeveelheden representatieve tekst moet zowel de fabrikant van een vertaalmachine als de bedenker van een nieuw soort tekstverwerker kunnen gebruiken als testmateriaal.

Tussen de buitenste schil en de binnenste zit nog een laag. In die laag vinden we de zogenaamde 'halffabrikaten' -- de stukken software die het mogelijk maken om met de grote corpora te werken. Als een computer succesvol met taal om moet kunnen gaan, moeten mensen vooralsnog allerlei informatie aan de tekst toevoegen. Wat voor soort informatie dat is, hangt af van het soort computerprogramma. Wie een vertaalcomputer bouwt van het Nederlands naar het Zweeds, zal minder belangstelling hebben voor de precieze uitspraak van het woord gerechtigheid, terwijl de bouwer van een sprekende computer nu juist minder boodschap heeft aan de vertaling van dat woord in het Zweeds.

Prestige

Het is belangrijk dat de binnenste schillen stevig zijn. Ze dragen de buitenste. Maar juist voor een middelgrote taal is het belangrijk dat de overheid werk aan de binnenste schillen ondersteunt. Voor bedrijven is de investering vaak te groot, zonder dat daar een direct voordeel tegenover staat. Wetenschappelijke onderzoeksinstellingen hebben ook weinig belangstelling voor dit soort infrastructurele projecten, die vanuit wetenschappelijk oogpunt weinig innovatief zijn. Het opstellen van lange woordenlijsten levert weinig wetenschappelijke prestige op. Toch is het uiteindelijk voor iedereen van belang dat het werk gebeurt. Daar ligt een taak voor de overheid.

Al met al is er nog veel werk te doen Wat is er eigenlijk allemaal al gebeurd? Het werk van de verschillende overheidsinstellingen richt zich vooral op de binnenste schil. Zo is onlangs een groot project 'Gesproken Nederlands' gestart, waarin zeer veel onderzoekers en mensen van de overheid en uit het bedrijfsleven samenwerken om een grote databank met tien miljoen gesproken Nederlandse woorden samen te stellen. Deze databank is goeddeels gefinancierd door de Nederlandse en de Vlaamse overheid en zal na voltooiing beheerd en geëxploiteerd worden door de Nederlandse Taalunie, die al meer van dit soort elektronische gegevensbanken onder haar beheer heeft.

Portugees

Belangrijk wordt ook gedaan door de Commissie Lexicale Vertaalvoorzieningen (CLVV). In opdracht van de Vlaamse en de Nederlandse ministers van onderwijs begeleidt deze commissie de ontwikkeling van vertaalwoordenboeken die voor commerciële uitgevers minder interessant zijn: woordenboeken voor etnische minderheden in Nederland en Vlaanderen bijvoorbeeld, of woordenboeken naar de kleinere Europese talen, zoals het Deens of het Portugees.

Een ander voorbeeld is de Centrale multifunctionele databank overheidsterminologie, een project om het taalgebruik van de Nederlandse en Vlaamse overheden uniformer en homogener te maken. De databank moet gebruikt kunnen worden door ambtenaren en juristen, maar als het goed is kan zo'n databank ook gebruikt worden om een vertaalprogramma te maken voor beleidsstukken in de Europese Unie. Op deze manier groeit langzaam maar zeker de eerste schil -- de infrastructurele kern.

cd-rom

Dat wil niet zeggen dat er aan de buitenste schillen niet gewerkt wordt. Een aantal jaar geleden nam de Taalunie het initiatief tot een overleg van Nederlandse en Vlaamse taaladviseurs. Zij stellen samen een CD-ROM samen met enkele honderden taaladviezen. Uiteindelijk kan dit een schrijfhulp worden dat in de derde schil zou thuishoren. 'Maar dan wel een product dat er nooit gekomen zou zijn als we het allemaal aan de markt hadden overgelaten', zegt Van Hoorde.

Toch zijn er nog wensen genoeg. Voor Internet bijvoorbeeld. Wie over de elektronische snelweg spreekt, praat al snel over dit wereldomspannende computerwerk. En niemand kan ontkennen dat het Engels nog steeds de voertaal van Internet is. Op het netwerk zijn een aantal zoekmachines te vinden, computerprogramma's die de gebruiker in staat stellen enkele tientallen miljoenen webpagina's tegelijkertijd.

Tritiu,

De beroemde Engelse taalkundige David Crystal liet zo'n zoekmachine enige tijd geleden zoeken op het woord tritium en vond een paar duizend documenten. Ze waren allemaal in het Engels gesteld. En zelfs als hij zocht op een Duits woord als Orchester bleken de helft van de gevonden documenten in het Engels gesteld. Ook de zoekmachines zelf zijn overigens overwegend Engelstalig. Wie alleen maar Nederlands lezen kan, zal grote moeite hebben de informatie te vinden die hij zoekt.

Hoe reageren andere Europese volkeren op de nieuwe taalkundige problemen die de elektronische snelweg stelt? 'Dat verschilt', zegt Van Hoorde. 'Sommige landen pakken het voortvarend aan. Frankrijk bijvoorbeeld, of Denemarken. In die landen is al aanzienlijk geïnvesteerd in een elektronische infrastructuur voor de eigen taal. Maar in een land als Duitsland is men wat verdeelder. Al loopt daar dan weer een zeer groot project om te komen tot een vertaalcomputer, Verbmobil. Dat project wordt deels door Siemens gesponsord.'

Als het aan Van Hoorde ligt, blijven wij niet achter. Het is van belang dat de verschillende partners -- overheid, bedrijfsleven, en wetenschap -- zoveel mogelijk samenwerken om te komen tot een solide infrastructuur. Daar zullen al die partners uiteindelijk alleen maar bij winnen, en het Nederlands ook. Wie zorgt er voor een Nederlandse rijbaan op de elektronische snelweg, als wij het niet doen?