Título:
|
Automatic acquisition of Named Entities for Rule-Based Machine Translation
|
Autor/a:
|
Toral, Antonio; Way, Andy
|
Otros autores:
|
International Workshop on Free/Open-Source Rule-Based Machine Translation (2nd : 2011 : Barcelona) |
Abstract:
|
This paper proposes to enrich RBMT
dictionaries with Named Entities
(NEs) automatically acquired from
Wikipedia. The method is applied
to the Apertium English-Spanish
system and its performance compared
to that of Apertium with and without
handtagged NEs. The system with
automatic NEs outperforms the one
without NEs, while results vary when
compared to a system with handtagged
NEs (results are comparable for
Spanish to English but slightly worst
for English to Spanish). Apart from
that, adding automatic NEs contributes
to decreasing the amount of unknown
terms by more than 10%. |
Abstract:
|
Este artículo propone enriquecer los diccionarios de traducción automática basada en reglas con nombres de entidades adquiridos automáticamente de Wikipedia. El método se aplica al sistema inglés-español de Apertium y su comportamiento se compara con el de Apertium con o sin nombres de entidades etiquetadas a mano. El sistema con nombres de entidades supera el que no los tiene, mientras que los resultados varían cuando se compara con un sistema con nombres de entidades etiquetadas a mano (los resultados son comparables de español a inglés pero algo peores de inglés a español). Aparte de eso, añadir nombres de entidades automáticos contribuye a hacer disminuir la cantidad de términos desconocidos en más de un 10%. |
Abstract:
|
Aquest article proposa enriquir els diccionaris de traducció automàtica basada en regles amb noms d'entitats adquirides automàticament de la Viquipèdia. El mètode s'aplica al sistema anglès-espanyol de l'Apertium i els resultats es comparen amb els de l'Apertium amb noms d'entitats etiquetats a mà i sense. El sistema amb noms d'entitats automàtics supera el que no en té, mentre que els resultats varien quan es comparen amb un sistema amb noms d'entitats etiquetats a mà (els resultats són comparables d'espanyol a anglès, però una mica pitjors d'anglès a espanyol). Això a part, afegir noms d'entitats automàtics contribueix a disminuir la quantitat de termes desconeguts en més d'un 10%. |
Materia(s):
|
-Named Entitites -automatic acquisition -nombres de entidades -adquisición automática -noms d'entitats -adquisició automàtica -Open source software -Machine translating -Computational linguistics -Programari lliure -Traducció automàtica -Lingüística computacional -Software libre -Traducción automática -Lingüística computacional |
Derechos:
|
http://creativecommons.org/licenses/by-nc-nd/3.0/es/ |
Tipo de documento:
|
Objeto de conferencia |
Editor:
|
Universitat Oberta de Catalunya
|
Compartir:
|
|