Nueva propuesta evolutiva para el agrupamiento de documentos en sistemas de recuperación de información

Castillo Sequera, José Luis

Show full item record

Date

2010

Affiliation

Universidad de Alcalá. Departamento de Ciencias de la Computación

Keywords

Recuperación de la información-Programas de ordenador

Computación evolutiva

Programación de ordenadores

Inteligencia artificial

Description / Notes

Texto en español y resumen en español e inglés

Fernández del Castillo Díez, José Raúl, codir.

Document type

info:eu-repo/semantics/doctoralThesis

Version

info:eu-repo/semantics/acceptedVersion

Access rights

info:eu-repo/semantics/openAccess

Abstract

El conocimiento explicito de las organizaciones se encuentra recogido en colecciones documentales controladas, a disposición de sus usuarios. Cuándo el número de documentos es elevado se necesitan herramientas para organizar y mostrar los contenidos de la colección, que permitan y faciliten a los usuarios explorar la colección para conocer mejor su naturaleza y descubrir relaciones, patrones, tendencias, y otras características para poder así ?comprender? la información. La necesidad de usar conocimientos en los Sistemas de Recuperación de Información empujó a los investigadores a analizar los sistemas inteligentes que procuran incorporar y usar dichos conocimientos con la finalidad de optimizar el sistema. En la presente tesis, se muestra un Sistema Evolutivo (SEV), y los resultados obtenidos en la construcción de un sistema de esta naturaleza. En este trabajo hacemos una aportación en el área de Recuperación de Información (RI), proponiendo el desarrollo de un nuevo sistema que, utilizando técnicas evolutivas, implemente un sistema de aprendizaje del tipo no supervisado, para agrupar los documentos de un Sistema de Recuperación de Información (SRI); en donde los grupos y el número de ellos son desconocidos a priori por el sistema. El criterio para realizar el agrupamiento de los documentos estará basado por la similitud y distancia de los documentos, formando así de esta manera grupos ó clustering de documentos afines, permitiendo así agrupar los documentos de un SRI de una manera aceptable, presentándose como una alternativa válida a los métodos de agrupamiento tradicionales, pudiéndose contrastar sus resultados experimentalmente con algunos de los métodos clásicos. Los lexemas más relevantes de cada documento, obtenidos mediante la aplicación de técnicas de RI, permiten enriquecer la información asociada a los documentos de la colección y utilizarlos como valores de metadatos para el algoritmo evolutivo. De esta forma, el sistema funciona mediante una metodología de procesamiento de documentos que selecciona los lexemas de los documentos mediante criterios de recuperación de información. Los resultados obtenidos demuestran la viabilidad de la construcción de una aplicación a gran escala de estas características, para integrarla en un sistema de gestión de conocimiento que tenga que manejar grandes colecciones documentales controladas.

Files in this item

Files	Size	Format	View
Tesis-Jose_Luis_Castillo_Seque ...	2.203Mb	PDF

Files	Size	Format	View
Tesis-Jose_Luis_Castillo_Seque ...	2.203Mb	PDF

Collections

CCOMPUT - Tesis [51]
Tesis Doctorales UAH [1942]