Download PDF

De dag van de fonetiek 2003 - over lopend onderzoek naar spraak en spraaktechnologie, Date: 2003/12/18 - 2003/12/18, Location: Utrecht, The Netherlands

Publication date: 2003-12-01

De dag van de fonetiek 2003 - over lopend onderzoek naar spraak en spraaktechnologie

Author:

Demuynck, Kris
Laureys, Tom ; Van Compernolle, Dirk ; Wambacq, Patrick

Keywords:

PSI_SPEECH

Abstract:

In deze presentatie beschrijven we de automatische generatie van foneemtranscripties en de bijhorende foneem- en woordsegmentaties zoals die gemaakt worden voor het Vlaamse deel van het Corpus Gesproken Nederlands. Eerst beschrijven we de automatische generatie van een netwerk van alternatieve foneemtranscripties op basis van de orthografie. Uit dit netwerk selecteert de automatische spraakherkenner het akoestisch best passende pad. Vervolgens behandelen we de gebruikte algoritmes voor het maken van woord- en foneemsegmentaties. We besluiten met een gedetailleerde analyse van de verschillen tussen enerzijds de manueel geproduceerde foneemtranscripties en woordoplijningen en anderzijds de resultaten van het automatische proces. Deze evaluatie gebeurt op de uiteenlopende componenten die binnen het CGN aanwezig zijn: van voorgelezen spraak over spontane conversaties tot telefoonspraak.