El aprendizaje semisupervisado como superación en precisión del aprendizaje supervisado en Desambiguación del Sentido de las Palabras
Autores
Sánchez de Madariaga, RicardoFecha de publicación
2008Palabras clave
Semántica-Proceso de datos
Procesado del lenguaje natural (Informática)
Lingüística computacional
Información|-Sistemas de almacenamiento y recuperación
Tipo de documento
info:eu-repo/semantics/doctoralThesis
Versión
info:eu-repo/semantics/acceptedVersion
Derechos de acceso
info:eu-repo/semantics/openAccess
Resumen
Se ha desarrollado un nuevo algoritmo de Desambiguación del Sentido de las Palabras (Word Sense Disambiguation) semisupervisado de autoarranque (bootstrapping) que alivia en gran medida el problema del Cuello de Botella de la Adquisición de Conocimiento (Knowledge Acquisition Bottleneck), que afecta de forma severa a los algoritmos supervisados actuales. Se demuestra que los algoritmos de Desambiguación del Sentido de las Palabras rinden una precisión mucho menor en corpus de texto general equilibrados (corpus reales) que en corpus de texto periodístico, debido a la naturaleza estereotipada y repetitiva de estos últimos. El algoritmo de autoarranque nuevo alcanza la precisión de los algoritmos supervisados en corpus reales, no periodísticos, y puede superarlos potencialmente debido al uso de una metodología de decisión binaria combinada con la propiedad un sentido por discurso (one-sense-per-discourse (OSPD) del lenguaje natural y a la mayor flexibilidad de los algoritmos de autoarranque (semisupervisados) que los supervisados, que les permite abordar mucho mejor que estos las fluctuaciones de dominio presentes en los corpus reales de texto general.
Ficheros en el ítem
Ficheros | Tamaño | Formato |
|
---|---|---|---|
cabecera.pdf | 664.1Kb |
![]() |
|
índice y abstract.pdf | 1.119Mb |
![]() |
|
tesis_Ricardo_Sánchez.pdf | 2.408Mb |
![]() |
Ficheros | Tamaño | Formato |
|
---|---|---|---|
cabecera.pdf | 664.1Kb |
![]() |
|
índice y abstract.pdf | 1.119Mb |
![]() |
|
tesis_Ricardo_Sánchez.pdf | 2.408Mb |
![]() |
Colecciones
- CCOMPUT - Tesis [51]
- Tesis Doctorales UAH [1782]