%0 Journal Article %A Navarro Colorado, Borja %T Por un análisis distante y profundo: un corpus piloto de la poesía lírica castellana del Siglo de Oro %D 2019 %@ 1137-8905 %U http://hdl.handle.net/10017/43771 %X En este trabajo se plantea la necesidad de combinar el análisis llamado «distante» (análisis panorámico de gran cantidad de texto literario) con el análisis profundo (análisis en detalle de diferentes aspectos lingüísticos o literarios). Para ello se propone la creación de amplios corpus literarios de referencia en los que, aprovechando los actuales avances en procesamiento del lenguaje natural, la información implícita del texto (tanto de tipo lingüístico como literario) esté marcada de manera explícita y formal. La propuesta se concreta en el diseño y desarrollo de un corpus piloto de la poesía lírica del Siglo de Oro que incluye poemas con diferentes modelos métrico-estróficos (sonetos, romances, liras, églogas, etc.) así como diversidad de autores. Actualmente consta de más de 52.000 versos anotados con información lingüística (palabras, lemas, categorías gramaticales y morfología) y literaria (tipo de poema o estrofa y métrica). Si bien la anotación general del corpus ha sido realizada de manera automática, un 10% de esa anotación (5069 versos) ha sido revisada, validada o, en su caso, corregida por expertos. Este 10%, en tanto que Gold Standard, es ya un primer paso tanto para el análisis distante y profundo de la poesía castellana como para el desarrollo de sistemas de procesamiento del lenguaje natural específicos para el texto literario y poético. %K Análisis distante %K Poesía lírica %K Siglo de Oro %K Métrica %K Procesamiento del Lenguaje Natural %K Anotación de corpus %K Distant reading %K Poetry %K Golden-Age %K Meter %K Natural Language Processing %K Corpus annotation %K Filología %K Philology %K Literatura %K Literature %~ Biblioteca Universidad de Alcala