2012-12-10T17:30:30Z
2012-12-10T17:30:30Z
2010-09
2012-12-10T17:30:31Z
En este artículo presentamos el desarrollo de un nuevo recurso de código abierto para el español: el treebank Tibidabo. La anotación se está llevando a cabo de forma semiautomática en la que, en primer lugar, el corpus es analizado automaticamente con una gramática simbólica del español basada en HPSG e implementada en el sistema Linguistic Knowledge Builder, y, en segundo lugar, los resultados del proceso de análisis se desambiguan manualmente. La existencia del treebank Tibidabo nos permitirá futuros trabajos de investigación para el desarrollo y evaluación de una arquitectura híbrida que combine métodos simbólicos y estadísticos para el PLN, así como investigaciones orientadas a la hibridización de técnicas de bajo y alto nivel para el PLN.
Article
Published version
English
Castellà (Llengua); Lingüística computacional; Gramàtica; Tecnologia de la informació; Spanish language; Computational linguistics; Grammar; Information technology
Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)
Procesamiento del lenguaje natural , 2010, vol. 45, num. 1, p. 113-119
(c) Marimon Felipe, Montserrat, 2010