Applied Speech Enhancement for Personal Communication

Document type: Licentiates
Full text:
Author(s): Nils Westerlund
Title: Applied Speech Enhancement for Personal Communication
Series: Blekinge Institute of Technology Licentiate Series
Year: 2003
Issue: 2
Pagination: 94
ISBN: 91-7295-020-x
ISSN: 1650-2140
Publisher: Blekinge Institute of Technology
City: Karlskrona
Organization: Blekinge Institute of Technology
Department: Department of Telecommunications and Signal Processing (Institutionen för telekommunikation och signalbehandling)
Department of Telecommunications and Signal Processing S-372 25 Ronneby
+46 455 38 50 00
Authors e-mail: nils.westerlund@bth.se
Language: English
Abstract: In our daily life noise is almost constantly present. At the same time our need to communicate reliably has probably never been this great. Surrounding noise impairs our ability to communicate by speech and causes the users of a speech communication system to strain both their hearing and their voices.

This licentiate thesis deals with speech enhancement for personal communication. A method for speech enhancement mainly aiming at every day communication situations is presented. The method boosts speech energy in a communication system, leaving background noise unaffected and it also tracks changes in background noise
characteristics. Hence it is an \emph{adaptive} speech enhancement algorithm. This is desirable since the noise characteristics of most every day noisy situations are more or less rapidly changing.

Methods for facilitating personal communication in severely disturbed environments are also presented. Instead of placing the communication microphone in front of the mouth, the microphone is placed inside the external auditory canal of the user. A pair of ear-muffs equipped with an active noise cancelling (ANC) system are fitted onto the user's head. This setup, possibly combined with some speech enhancement method, enables the user to communicate even under the most extreme noise situations. The setup characteristics are examined and the resulting speech quality and intelligibility are evaluated using a speech recognizer based on Hidden Markov Models.
Summary in Swedish: Buller är i princip konstant närvarande i vårt moderna dagliga liv. Samtidigt har vårt behov av säker och tillförlitlig kommunikation människor emellan kanske aldrig varit så stort. Omgivande buller påverkar vår förmåga att kommunicera med varandra negativt och tvingar användarna av ett kommunikationssystem att anstränga hörsel såväl som röster. Denna licentiatavhandling behandlar talkvalitetsförbättringsmetoder för personkommunikation. En metod för talkvalitetsförbättring som i huvudsak fokuserar på vardaglig personkommunikation presenteras. Metoden förstärker talenergi i det aktuella kommunikationssystemet men påverkar ej bakgrundsbullret. Metoden är adaptiv i meningen att den detekterar och följer förändringar i bakgrundsbullrets karaktäristik. Detta är önskvärt eftersom de flesta bullersituationer en användare utsätts för i verkliga livet är mer eller mindre snabbt föränderliga. Metoder för att underlätta personkommunikation i miljöer där det omgivande bullret är mycket kraftigt presenteras också. Istället för att - som normalt - placera kommunikationsmikrofonen framför munnen på användaren, placeras istället denna mikrofon i hörselgången på användaren. Därefter placeras ett par hörselkåpor utrustade med aktiv bullerreducering (ANC) över användaren öron. Med denna metod kan användaren kommunicera även i de mest extrema bullersituationer. Metoden kan även kombineras med någon form av talkvalitetsförbättringsalgoritm. Metoden utvärderas och den resulterande talkvalitén och taluppfattbarheten analyseras med hjälp av ett taligenkänningssystem baserat på en så kallad Hidden Markov Model (HMM).
Subject: Signal Processing\Speech Enhancement
Signal Processing\Active Noise and Vibration Control
Keywords: Speech Enhancement, Active Noise Control
Note: This Licentiate Thesis is also published at http://www.its.bth.se/staff/nwe
URN: urn:nbn:se:bth-00217
Edit