Inlämning av Examensarbete / Submission of Thesis

Balakrishna Lavu; Ashokkumar P V MEE10:114, pp. 42. ING/School of Engineering, 2011.

The work

Författare / Author: Balakrishna Lavu, Ashokkumar P V
bkla08@student.bth.se, vapo08@student.bth.se
Titel / Title: Speech Enhancement using Constrained-ICA with Bessel Features
Abstrakt Abstract:

In this thesis, we proposed an approach for extracting a desired speech signal from a mixed source signal using the ICA-R algorithm and Bessel features. Here the desired
speech signal and the reference signal are two different speech utterances of a same speaker.

In the current existing literature most of the methods deal with designing the reference signal with prior information of the target speech signal. The crucial problem is the design of reference signal in advance which is close to the desired signal when the desired source signal is very week in mixed signals and also when there is no prior information about the desired source signal.

In the proposed method we do not require any prior information about the desired speech signal that has to be extracted. The ICA-R algorithm is extended to use Bessel coefficients of the observed signals and the reference signal for processing as they are more efficient in representing speech-like waveform.

From the simulation results and the performance analysis in chapter 4, comparing the proposed method with one of the previous existing methods shows that the proposed
method is more effective. This shows that the computation done at the feature level i.e. the Bessel coefficients of the signals yields better results than on the sample values.

This is very useful for many applications such as speaker verification, speaker identification and so on even when the desired signal is very week in mixed signals. An example of real world application where the proposed method is useful is the voice recognition and speaker verification login even in the presence of external disturbances and also in voice security applications.

Populärvetenskaplig beskrivning / Popular science summary: I denna avhandling har vi föreslagit en metod för att utvinna en önskad tal signal från en blandad källa signal genom att använda ICA-R algoritm och Bessel funktioner.
Här önskad talsignalen och referenssignalen är två olika tal yttranden på ett och samma högtalare. I den nuvarande befintlig litteratur flesta av metoderna behandlar utformningen referenssignalen med förhandsinformation till målet talsignalen. Det avgörande problemet är utformningen av referenssignalen i förväg vilket är nära den önskade signalen när önskad signalkälla är mycket vecka i blandade signaler och även när det inte finns någon tidigare information om den önskade signalen.
I den föreslagna metoden vi inte kräver någon som helst förhandsinformation om den önskade talsignalen som ska extraheras. ICA-R algoritm utvidgas till att använda Bessel koefficienter av de observerade signaler och referenssignalen för bearbetning eftersom de är mer effektiva i motsvarande tal-liknande vågform. Från simuleringen resultat och resultatanalys i kapitel 4, jämföra den föreslagna metoden med en av de tidigare befintliga metoder visar att den föreslagna metoden är mer effektiv.
Detta visar att beräkningen görs på funktionen nivå dvs Bessel koefficienter av signalerna ger bättre resultat än på provet värden. Detta är mycket användbart för många applikationer såsom verifiering av talare, högtalare identifiering och så vidare även när den önskade signalen är mycket vecka i blandade signaler. Ett exempel på verkliga världen ansökan då den föreslagna metoden är användbar är röstigenkänning och verifiering av talare login även i närvaro av yttre störningar och även i rösten säkerhetsapplikationer.
Ämnesord / Subject: Signalbehandling - Signal Processing

Nyckelord / Keywords: Independent Component Analysis, Speech Recognition, Fourier Bessel Features

Publication info

Dokument id / Document id:
Program:/ Programme Magisterprogram i Elektroteknik / Master of Science in Electrical Engineering
Registreringsdatum / Date of registration: 01/31/2011
Uppsatstyp / Type of thesis: Masterarbete/Master's Thesis (120 credits)

Context

Handledare / Supervisor: Dr. Suryakanth V Gangashetty
svg@iiit.ac.in
Examinator / Examiner: Dr. Nedelko Grbic
Organisation / Organisation: Blekinge Institute of Technology
Institution / School: ING/School of Engineering

+46 455 38 50 00
I samarbete med / In co-operation with: Indian Institute of Information Technology, Hyderabad

Files & Access

Bifogad uppsats fil(er) / Files attached: speech enhancement using constrained ica .pdf (1744 kB, öppnas i nytt fönster)