A hybrid approach to treebank construction

Data de publicació

2012-11-27T13:54:54Z

2012-11-27T13:54:54Z

2012-09

2012-11-27T13:54:54Z

Resum

Este artículo describe investigación sobre los efectos de la desambiguación morfosintáctica usada como un preproceso de un analizador sint´actico profundo basado en HPSG, en el contexto del desarrollo de un treebank del español de código abierto, en el entorno de DELPH-IN. La anotación treebank se realiza manualmente tomando las decisiones apropiadas entre las opciones propuestas por el sistema y ordenadas por un módulo estadístico. Los experimentos presentados muestran que el uso de un etiquetador reduce la ambigüedad de las frases, y contribuye a limitar la cantidad de frases cuyo análisis sobrepasa a el límite de tiempo, y ayuda a al m´odulo estadístico a clasificar el árbol correcto entre los n mejores. Por un lado, nuestros resultados validan los beneficios ya reportados en la literatura de tal preproceso de análisis profundo con respecto a la velocidad, cobertura y precisión. Por otro lado, proponemos una estrategia basada en existentes herramientas de código abierto y recursos para desarrollar con alta consitencia treebanks de sintaxis profunda para idiomas con limitada disponibilidad de recursos lingüísticos.

Tipus de document

Article


Versió publicada

Llengua

Anglès

Publicat per

Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN)

Documents relacionats

Procesamiento del lenguaje natural , 2012, vol. 49, num. 1, p. 139-146

Citació recomanada

Aquesta citació s'ha generat automàticament.

Drets

(c) Marimon Felipe, Montserrat et al., 2012

Aquest element apareix en la col·lecció o col·leccions següent(s)