The Tibidabo Treebank

Data de publicació

2012-12-10T17:30:30Z

2012-12-10T17:30:30Z

2010-09

2012-12-10T17:30:31Z

Resum

En este artículo presentamos el desarrollo de un nuevo recurso de código abierto para el español: el treebank Tibidabo. La anotación se está llevando a cabo de forma semiautomática en la que, en primer lugar, el corpus es analizado automaticamente con una gramática simbólica del español basada en HPSG e implementada en el sistema Linguistic Knowledge Builder, y, en segundo lugar, los resultados del proceso de análisis se desambiguan manualmente. La existencia del treebank Tibidabo nos permitirá futuros trabajos de investigación para el desarrollo y evaluación de una arquitectura híbrida que combine métodos simbólicos y estadísticos para el PLN, así como investigaciones orientadas a la hibridización de técnicas de bajo y alto nivel para el PLN.

Tipus de document

Article


Versió publicada

Llengua

Anglès

Publicat per

Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)

Documents relacionats

Procesamiento del lenguaje natural , 2010, vol. 45, num. 1, p. 113-119

Citació recomanada

Aquesta citació s'ha generat automàticament.

Drets

(c) Marimon Felipe, Montserrat, 2010

Aquest element apareix en la col·lecció o col·leccions següent(s)