The Tibidabo Treebank

Fecha de publicación

2012-12-10T17:30:30Z

2012-12-10T17:30:30Z

2010-09

2012-12-10T17:30:31Z

Resumen

En este artículo presentamos el desarrollo de un nuevo recurso de código abierto para el español: el treebank Tibidabo. La anotación se está llevando a cabo de forma semiautomática en la que, en primer lugar, el corpus es analizado automaticamente con una gramática simbólica del español basada en HPSG e implementada en el sistema Linguistic Knowledge Builder, y, en segundo lugar, los resultados del proceso de análisis se desambiguan manualmente. La existencia del treebank Tibidabo nos permitirá futuros trabajos de investigación para el desarrollo y evaluación de una arquitectura híbrida que combine métodos simbólicos y estadísticos para el PLN, así como investigaciones orientadas a la hibridización de técnicas de bajo y alto nivel para el PLN.

Tipo de documento

Artículo


Versión publicada

Lengua

Inglés

Publicado por

Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)

Documentos relacionados

Procesamiento del lenguaje natural , 2010, vol. 45, num. 1, p. 113-119

Citación recomendada

Esta citación se ha generado automáticamente.

Derechos

(c) Marimon Felipe, Montserrat, 2010

Este ítem aparece en la(s) siguiente(s) colección(ones)