Home | IM-Pact | BATS

BATS

Topic and Speaker Tracking in Broadcast Archives

Dankzij de krachtige internetzoekmachines zijn we gewoon geworden dat we grote hoeveelheden informatie makkelijk kunnen doorzoeken a.d.h.v. trefwoorden. Het doorzoeken van multimedia- of audiodocumenten staat daarentegen nog in de kinderschoenen. In principe is het niet moeilijk: je zet de gesproken informatie om in een geschreven versie d.m.v. een automatische spraakherkenner en vervolgens gebruik je teksttechnologieën om de tekst te ontsluiten.

In werkelijkheid ligt dat niet zo voor de hand. Vooreerst is het moeilijk om een goede kwaliteit van de automatische transcriptie te bekomen. Achtergrondgeluid, muziek, jingles en een beperkte signaalbandbreedte (bvb. telefoonspraak) zijn externe factoren die nefast (schadelijk) zijn. Maar ook dialectische spraak, door mekaar praten, slechte articulatie, spontane spraak met hernemingen, aarzelingen en een afwijkende grammatica degraderen de kwaliteit van de transcriptie. Deze nauwkeurigheidsproblematiek vormt een eerste luik voor de onderzoeker in Leuven. Daarnaast stelt er zich een probleem om het vocabularium van de spraakherkenner up-to-date te houden wanneer nieuwe woorden (in het bijzonder eigennamen) verschijnen. Een automatische spraakherkenner maakt immers gebruik van een exhaustieve woordenlijst waarvan de uitspraak gekend dient te zijn. Pas dan kan men verwachten dat wanneer een spreker een woord gebruikt, dat ook correct in de automatische trancriptie verschijnt. Het onderhouden van de woordenlijst met uitspraak vergt een dure manuele interventie, die bovendien niet noodzakelijk reeds gebeurd is op het moment dat de transcriptie van een document gebeurt. Daarom proberen we in een tweede onderzoeksluik voor de Leuvense doctorandus de problematiek te verschuiven naar een akoestische match i.p.v. een tekstuele, zodat een juiste orthografische transcriptie onbelangrijk wordt.
Maar audiodata bieden ook nieuwe zoekmogelijkheden die niet zo voor de hand liggen voor tekstdata: het wordt ook mogelijk om te zoeken op sprekeridentiteit. Zo kan je een citaat of een krasse uitspraak van een prominent persoon terugvinden. Ook kan je documenten linken omdat dezelfde spreker erin voor komt, wat een nieuwe manier is om door data te browsen. Sprekerinformatie geeft bovendien een thematische link. Het gebruik van sprekerinformatie wordt in Nijmegen onderzocht. Het herkennen van sprekers wordt bemoeilijkt door de impact van tijd (over de jaren heen, maar ook ’s ochtends tegenover ’s avonds), opnamemedium, spreekstijl, stress, ... op de stem.

Hoewel het doorzoeken van audiodocumenten nieuwe mogelijkheden biedt voor alle internetgebruikers spitst BATS zich toe op het onstluiten en doorzoekbaar maken van de archieven van radio- en TV-stations in Vlaanderen en Nederland. Een dergelijke ontsluiting opent nieuwe perspectieven voor programmamakers en journalisten.

Partners:
• K.U.Leuven / ESAT / PSI
• R.U.Nijmegen / CLTS
• VRT


 

Naam
Organisatie
Adres
E-mailadres *
Telefoonummer
Onderwerp *
Uw reactie *
Velden met een * zijn verplicht.
U ontvangt een kopie van dit bericht.