Diseño, implementación y evaluación de un demostrador de captura y procesamiento de audio multicanal en espacios inteligentes
Authors
Caso Alba, SandraDirector
Macías Guarasa, JavierDate
2018Keywords
Demostrador en tiempo real
Sistemas de procesado de la voz
Localización acústica
Espacios inteligentes
Document type
info:eu-repo/semantics/bachelorThesis
Version
info:eu-repo/semantics/acceptedVersion
Rights
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Access rights
info:eu-repo/semantics/openAccess
Abstract
Este proyecto describe el diseño, desarrollo, implementación y evaluación de un demostrador en tiempo
real de captura y procesamiento de audio multicanal para localización de hablantes mediante agrupaciones
de micrófonos dentro de espacios inteligentes.
Para conseguir este objetivo se han combinado los resultados de trabajos previos de otros Proyectos
Fin de Grado y Fin de Máster en los que se desarrollaron librerías de adquisición y reproducción de audio
multicanal, algorítmica de detección de actividad de voz en entornos con agrupaciones de micrófonos,
módulos de visualización de entornos virtuales y algorítmica de localización de locutores, integrando su
funcionalidad y adaptándola a las exigencias del funcionamiento en tiempo real.
Asimismo, se ha completado el hardware disponible en la sala ispace, que consta de dos agrupaciones de
micrófonos, implementando las conexiones oportunas para añadir dos nuevos arrays al sistema, estudiando
la geometría de estos. Asimismo, se ha diseñado e implementado un quinto array que consta de una nueva
topología con el fin de estudiar sus ventajas.
Palabras clave: Localización acústica, detección de actividad de voz, demostrador en tiempo real,
procesamiento basado en agrupaciones de micrófonos, espacio inteligente. This project describes the design, development, implementation and evaluation of a real time demonstrator
of multi-channel audio capture and processing for localization of speakers using microphone arrays in
smart spaces.
To achieve this goal it has been combined the results of previous Thesis which developed multichannel
acquisition and reproduction libraries, activity voice detection algorithms in environments with microphone
clusters, virtual environment visualization modules and speaker location algorithms, integrating
their functionalities and adapting them to real time operating requirements.
Likewise, the hardware available in the room ispace, which consists of two groups of microphones,
has been completed, implementing the appropriate connections to add two new arrays to the system,
studying the geometry of these. In addition, a fifth array consisting of a new topology has been designed
and implemented in order to study its advantages.
Keywords: Acoustic localization, voice activity detection, real time demonstration, microphone array
processing, smart space.
Files in this item
Files | Size | Format |
|
---|---|---|---|
TFG_Caso_Alba_2018.pdf | 12.50Mb |
|
Files | Size | Format |
|
---|---|---|---|
TFG_Caso_Alba_2018.pdf | 12.50Mb |
|