Introducties

Arjan Na mijn studies Geofysica en Italiaans en een promotie in de Fonetiek, heb ik eerst drie jaar op twee universiteiten in Duitsland gewerkt (Düsseldorf en Ulm) en vervolgens drie jaar in Brussel bij het roemruchte TST-bedrijf Lernout & Hauspie. Op deze wijze ben stap-voor-stap in de wereld van Taal- en Spraaktechnologie (TST) terecht gekomen. Een fascinerende omgeving waar techniek gecombineerd wordt met "de mens" in de ruime zin van het woord. In mijn Brusselse periode werd duidelijk dat ik niet in een "alleen maar" commerciële omgeving wilde werken en dat de combinatie onderzoekswereld en bedrijfsleven eigenlijk wel redelijk ideaal leek. Eenmaal terug in Nederland (1998) kon dit verwezenlijkt worden doordat twee uitstaande sollicitaties (Universiteit Twente en ComSys) beiden binnen een paar dagen positief beoordeeld werden. Sindsdien verdeel ik mijn werkzame leven tussen academia en bedrijfsleven. In 2001 werd ik tot mijn grote vreugde door Telecats gevraag bij hen te komen werken: iets dat ik nu al meer dan 10-jaar met erg veel plezier doe! Een van de zaken die ik daar probeer te doen, is de transfer van in de academische wereld opgedane kennis op het gebied van Taal- en Spraaktechnologie naar "het bedrijfsleven": iets dat tot nu toe aardig lukt.
In 2009 kwam daar nog iets bij: CLARIN.NL, het infrastructuurprogramma voor de Geesteswetenschappen. Doel van CLARIN is het standaardiseren van zowel tekstuele bronnen als tools die daar iets mee kunnen doen. Een voorbeeld is spraakherkenning: slechts weinig onderzoekers kunnen zomaar een spraakherkenner met een adequaat taalmodel installeren op de computers op hun werk. Ook kunnen de meeste niet zonder technische hulp bestaande tekst-corpora omzetten in een voor de herkenner geschikt formaat. Clarin beoogt een infrastructuur aan te leggen waarmee onderzoekers zonder al te veel technische knowhow gebruik kunne maken van de beschikbare data en tools. In 2015 loopt CLARIN-NL af maar ga ik verder als EB-lid van CLARIAH: de veelzijdiger opvolger van CLARIN.