Creación, etiquetación y desambiguación de un corpus de referencia del español

Fecha de publicación

2019-03-08T10:11:19Z

2019-03-08T10:11:19Z

2001

2019-03-08T10:11:20Z

Resumen

En este artículo presentamos los criterios para la anotación y desambiguación morfosintáctica de un corpus de referencia del español que será de libre disposición, proponiendo respuestas concretas a casos problemáticos de ambas tareas. El objetivo final es disponer de una colección escrita de 1 millón de palabras desambiguadas manualmente a nivel tanto morfológico como sintáctico, que pueda utilizarse para el aprendizaje automático así como para la consulta lingüística. Discutimos detalladamente la categorización de las palabras del español así como los criterios lingüísticos de desambigüación.

Tipo de documento

Artículo


Versión publicada

Lengua

Castellano

Publicado por

Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)

Documentos relacionados

Reproducció del document publicat a: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/3339

Procesamiento del lenguaje natural , 2001, num. 27, p. 21-28

Citación recomendada

Esta citación se ha generado automáticamente.

Derechos

(c) Civit, Montse et al., 2001

Este ítem aparece en la(s) siguiente(s) colección(ones)