Inlämning av Examensarbete / Submission of Thesis

Harish Midathala ET2408, pp. 72. ING/School of Engineering, 2012.

The work

Författare / Author: Harish Midathala
hami10@student.bth.se
Titel / Title: Speech enhancement methods in hands-free communication with emphasis on Optimal SNIR Beamformer
Översatt titel / Translated title: Tal förbättring metoder i handsfree-kommunikation med tonvikt på Optimal SNIR strålformaren
Abstrakt Abstract:

A basic speech enhancement can be achieved by the suppression of background noise and reverberation from the clean speech. The point to be noted is to achieve it with a low computational complexity. The aim is to estimate signal arriving optimally from the desired direction in the presence of reverberant-noisy speech signal. Recent studies show that this can be achieved by designing various kinds of robust fixed and adaptive beamformers. A beamformer does spatial filtering in the sense that it separates two signals with overlapping frequency content originating from distinctive directions. In this contribution, robust beamformers namely Elkos beamformer, Wiener beamforming and optimal signal to noise interference ratio (SNIR) beamformer are designed and analyzed collaboratively in a group under the consideration of hearing aid constraints such as the microphone distance and different real world room dimensions. A fractionally delayed (FD) all pass Thiran filters are designed to get a maximally flat group delay. A virtual room image model is designed to achieve different dimensions of the room and their reverberant speech signals.
The objective of this thesis is to design and implement an optimal SNIR beamformer in anechoic and reverberant environments with different noises, i.e. wind, white, factory and interference. It is implemented and simulated offline in MATLAB. The performance of the optimal SNIR Beamformer is evaluated by considering the objective measures such as SNRI, SD, ND, RR and PESQI under different noisy environments in anechoic and reverberated environments. These parameters are measured by assuming input SNR levels at 0dB, 5dB, 10 dB, 15 dB, 20 dB and 25 dB. In addition to this a new parameter RR is also evaluated in reverberated environment. This parameter is measured by varying the number of microphones. The reverberation power suppression is analyzed by using RR. Speech quality is analyzed based on signal to noise ratio Improvement and speech intelligibility is measured using PESQ for different noisy environments. Results show that optimal SNIR beamformer performs best compared to all other beamformers due to its inherent properties.

Populärvetenskaplig beskrivning / Popular science summary: En grundläggande tal förbättring kan uppnås genom undertryckande av bakgrundsbrus och efterklang från den rena tal. Den punkt som skall noteras är att uppnå den med en låg beräkningskomplexitet. Syftet är att uppskatta signal som anländer optimalt från den önskade riktningen i närvaro av reverberenta-brusig talsignal. Nyligen genomförda studier visar att detta kan uppnås genom att konstruera olika typer av robusta fasta och adaptiv lobformare. En lobformare inte rymdfiltrering i den meningen att den separerar två signaler med överlappande frekvenser som härrör från distinkta riktningar. I detta bidrag Elkos robusta lobformare nämligen strålbildaren, Wiener lobformning och optimal signal-brus interferens förhållande (SNIR) strålbildaren utformas och analyseras samarbeta i en grupp under övervägande av hörapparat begränsningar, till exempel mikrofonen avståndet och olika verkliga dimensioner rum. En bråkdel försenade (FD) alla pass Thiran filter är utformade för att få en maximalt flat grupplöptid. Ett virtuellt rum bilden är utformad för att uppnå olika dimensioner i rummet och deras ekande signaler tal.
           Syftet med denna uppsats är att utforma och genomföra en optimal SNIR strålbildaren i ekofria och reverberenta miljöer med olika ljud, dvs vind, vit, fabriker och störningar. Den genomförs och simulerade offline i MATLAB. Utförandet av den optimala SNIR strålbildaren utvärderas genom att beakta de objektiva åtgärder som SNRI, SD, ND, RR och PESQI under olika bullriga miljöer i ekofria och ekade miljöer. Dessa parametrar mäts genom ett antagande in SNR nivåer 0dB, 5 dB, 10 dB, 15 dB, 20 dB och 25 dB. Utöver detta en ny parameter RR, utvärderas även återreflekteras miljö. Denna parameter mäts genom att variera antalet mikrofoner. Efterklangstiden effektdämparstavar analyseras med hjälp av RR. Tal kvalitet analyseras utifrån signal-brus-förhållande Förbättring och taluppfattbarhet mäts med PESQ för olika bullriga miljöer. Resultaten visar att optimal SNIR strålbildaren bästa utför jämfört med alla andra lobformare på grund av dess inneboende egenskaper.
Ämnesord / Subject: Signalbehandling - Signal Processing
Elektroteknik - Electrotechnology
Nyckelord / Keywords: signal to noise ratio, Beamforming, Reverberated and Anechoic, Speech intelligibility, Reverberation.

Publication info

Dokument id / Document id: houn-8vgjsy
Program:/ Programme Magisterprogram i Elektroteknik / Master of Science in Electrical Engineering
Registreringsdatum / Date of registration: 06/21/2012
Uppsatstyp / Type of thesis: Masterarbete/Master's Thesis (120 credits)

Context

Handledare / Supervisor: Dr. Nedelko Grbic
nedelko.grbic@bth.se
Examinator / Examiner: Dr. Benny Sällberg
Organisation / Organisation: Blekinge Institute of Technology
Institution / School: ING/School of Engineering

+46 455 38 50 00
Anmärkningar / Comments:

M.Thyagaraju, H.no 5/72, Bhairavanager, Behind JNTU college, ANANTAPUR, Andhra Pradesh, India-515002.
EmailID:hami10@student.bth.se
Contact PH: 0046760310134, 00919440508157.

Files & Access

Bifogad uppsats fil(er) / Files attached: bth2012harish.pdf (2243 kB, öppnas i nytt fönster)