Analysis, implementation and evaluation of blind separation algorithms from audio sources
Authors
Centeno Álvarez, RubénDate
2021Keywords
Separación ciega de fuentes
Factorización de matrices no negativas
Localización de fuentes de audio
STFT
Matlab
Blind source separation
Non-negative matrix factorization
Acoustic source localization
Document type
info:eu-repo/semantics/bachelorThesis
Version
info:eu-repo/semantics/acceptedVersion
Rights
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Access rights
info:eu-repo/semantics/openAccess
Abstract
El propósito de este Trabajo de Fin de Grado (TFG) sería realizar un banco de pruebas con distintos
méetodos utilizados para la separacióon ciega de fuentes de audio, Blind Source Separation (BSS), que sería
usado en algoritmos de localización acústica para mejorar su precisión.
Bajo este propósito, se usaría la herramienta software MATLAB para implementar y evaluar los
distintos sistemas propuestos. Consideraremos que la mayoría de los sistemas relacionados en la literatura
científi ca se componen de tres fases: pasar al dominio tiempo-frecuencia mediante la realización de la
Short Time Fourier Transform (STFT) de la mezcla de audio, separar la misma en las diferentes fuentes
aplicando tecnicas Blind Source Separation (BSS), y la nal reconstrucción de las señales obtenidas y
paso al dominio del tiempo utilizando la Inverse Short Time Fourier Transform (ISTFT).
Con el n de alcanzar los objetivos descritos, se ha dividido el trabajo en las siguientes tareas: diseño
de los bloques encargados de realizar la STFT y la ISTFT, que serían comunes para todos los métodos
BSS, desarrollo del banco de métodos BSS y de la etapa de ltrado, utilizando un ltro Wiener o similar,
que también sería común a todos los métodos. Finalmente, se probaría y evaluaría el sistema completo
mediante mezclas de audio obtenidas en entornos similares al que se desea aplicar el sistema para mejorar
la localización de las distintas fuentes. The purpose of this bachelor thesis work will be to perform a test bench with di erent methods used
for Blind Source Separation (BSS) of people's voices, to be used in acoustic localization algorithms to
improve their accuracy.
For this purpose, the MATLAB software tool will be used to implement and evaluate the di erent
proposed systems. We will consider that most related systems in the scienti c literature have three phases:
move the audio source to the time-frequency (TF) domain by perfoming the Short Time Fourier Transform
(STFT) to the audio mix, separate the audio into the di erent sources applying BSS techniques, and a
nal task with the obtained signals of reconstruction and transition to the time domain using the Inverse
Short Time Fourier Transform (ISTFT).
For reaching the objectives described, the project has been divided in the following tasks: design
of the blocks responsible for carrying out the STFT and the ISTFT that will be common for all BSS
methods and the development of the BSS method bank and of the ltering stage, using a Wiener lter
or similar, which will also be common to all methods. Last of all, testing and evaluation of the complete
system using audio mixes obtained in similar environments to the one in which the system is to be applied
to improve the location of the various sources.
Files in this item
Files | Size | Format |
|
---|---|---|---|
TFG_Centeno_Álvarez_2021.pdf | 3.975Mb |
|
Files | Size | Format |
|
---|---|---|---|
TFG_Centeno_Álvarez_2021.pdf | 3.975Mb |
|