Aproximación al análisis comparativo de voz artificial mediante un sistema de reconocimiento automático de locutores
Authors
Molinero Escapa, AnaDate
2021Affiliation
Universidad de AlcaláBibliographic citation
Molinero Escapa, Ana. Aproximación al análisis comparativo de voz artificial mediante un sistema de reconocimiento automático de locutores. Universidad de Alcalá, 2021
Keywords
Acústica Forense
análisis comparativo de voces
voz sintética
redes neuronales artificiales
Sistema de Reconocimiento Automático de Locutores
modelo de locutor
audio test
audio de impostor
Document type
info:eu-repo/semantics/masterThesis
Version
info:eu-repo/semantics/acceptedVersion
Rights
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Access rights
info:eu-repo/semantics/openAccess
Abstract
El ritmo de vida acelerado al que nos vemos sometidos en los países desarrollados
ha llevado a las empresas a dar respuesta a una necesidad de uso y control de software
y hardware mucho más efectiva. Es así como se incorpora la utilización de la voz para
facilitar cualquier comunicación cotidiana, desde consultar el tiempo que va a hacer
durante el día hasta la interacción con sistemas sofisticados que utilizan la inteligencia
artificial para realizar tareas más complejas como solicitar la lectura de un texto.
En este último punto se centra el presente trabajo, que aborda el estudio
comparativo de muestras de voz sintética, obtenidas a partir de tres aplicaciones
gratuitas (SPIK-AI, NUANCE VOCALIZER y Play HT), utilizando BATVOX 4.1, el
Sistema de Reconocimiento Automático de Locutores usado por la mayoría de
laboratorios de Acústica Forense de todo el mundo. Nuestro objetivo es evaluar su
capacidad de discriminación frente a este tipo de locuciones y determinar si los
resultados alcanzados tienen una validez suficiente para considerar su utilización.
El experimento realizado revela, por un lado, que la mayoría de muestras de voz
artificial no cumplen con los requisitos requeridos por el sistema, bien debido a su
formato de audio o bien por los desajustes con las poblaciones de referencia
disponibles. Por otro lado, para las muestras útiles, aunque los resultados no son
incoherentes, se observa que la capacidad de discriminación no es del todo adecuada
por lo que no es recomendable su uso con este tipo de habla.
Files in this item
Files | Size | Format |
|
---|---|---|---|
TFM_Molinero_Escapa_Ana_2021.pdf | 1.773Mb |
|
Files | Size | Format |
|
---|---|---|---|
TFM_Molinero_Escapa_Ana_2021.pdf | 1.773Mb |
|