Creación, etiquetación y desambiguación de un corpus de referencia del español

Publication date

2019-03-08T10:11:19Z

2019-03-08T10:11:19Z

2001

2019-03-08T10:11:20Z

Abstract

En este artículo presentamos los criterios para la anotación y desambiguación morfosintáctica de un corpus de referencia del español que será de libre disposición, proponiendo respuestas concretas a casos problemáticos de ambas tareas. El objetivo final es disponer de una colección escrita de 1 millón de palabras desambiguadas manualmente a nivel tanto morfológico como sintáctico, que pueda utilizarse para el aprendizaje automático así como para la consulta lingüística. Discutimos detalladamente la categorización de las palabras del español así como los criterios lingüísticos de desambigüación.

Document Type

Article


Published version

Language

Spanish

Publisher

Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)

Related items

Reproducció del document publicat a: http://journal.sepln.org/sepln/ojs/ojs/index.php/pln/article/view/3339

Procesamiento del lenguaje natural , 2001, num. 27, p. 21-28

Recommended citation

This citation was generated automatically.

Rights

(c) Civit, Montse et al., 2001

This item appears in the following Collection(s)