Automatic acquisition of Named Entities for Rule-Based Machine Translation

dc.contributor
International Workshop on Free/Open-Source Rule-Based Machine Translation (2nd : 2011 : Barcelona)
dc.contributor.author
Toral, Antonio
dc.contributor.author
Way, Andy
dc.date
2010-12-20T14:02:02Z
dc.date
2010-12-20T14:02:02Z
dc.date
2011-01-20
dc.identifier.citation
Toral, Antonio; Way, Andy (2011, January). "Automatic acquisition of Named Entities for Rule-Based Machine Translation". Proceedings of the Second International Workshop on Free/Open-Source Rule-Based Machine Translation (2011: Barcelona). <http://hdl.handle.net/10609/5644>
dc.identifier.citation
978-84-693-9517-2
dc.identifier.uri
https://hdl.handle.net/10609/5644
dc.description.abstract
This paper proposes to enrich RBMT dictionaries with Named Entities (NEs) automatically acquired from Wikipedia. The method is applied to the Apertium English-Spanish system and its performance compared to that of Apertium with and without handtagged NEs. The system with automatic NEs outperforms the one without NEs, while results vary when compared to a system with handtagged NEs (results are comparable for Spanish to English but slightly worst for English to Spanish). Apart from that, adding automatic NEs contributes to decreasing the amount of unknown terms by more than 10%.
dc.description.abstract
Este artículo propone enriquecer los diccionarios de traducción automática basada en reglas con nombres de entidades adquiridos automáticamente de Wikipedia. El método se aplica al sistema inglés-español de Apertium y su comportamiento se compara con el de Apertium con o sin nombres de entidades etiquetadas a mano. El sistema con nombres de entidades supera el que no los tiene, mientras que los resultados varían cuando se compara con un sistema con nombres de entidades etiquetadas a mano (los resultados son comparables de español a inglés pero algo peores de inglés a español). Aparte de eso, añadir nombres de entidades automáticos contribuye a hacer disminuir la cantidad de términos desconocidos en más de un 10%.
dc.description.abstract
Aquest article proposa enriquir els diccionaris de traducció automàtica basada en regles amb noms d'entitats adquirides automàticament de la Viquipèdia. El mètode s'aplica al sistema anglès-espanyol de l'Apertium i els resultats es comparen amb els de l'Apertium amb noms d'entitats etiquetats a mà i sense. El sistema amb noms d'entitats automàtics supera el que no en té, mentre que els resultats varien quan es comparen amb un sistema amb noms d'entitats etiquetats a mà (els resultats són comparables d'espanyol a anglès, però una mica pitjors d'anglès a espanyol). Això a part, afegir noms d'entitats automàtics contribueix a disminuir la quantitat de termes desconeguts en més d'un 10%.
dc.language.iso
eng
dc.publisher
Universitat Oberta de Catalunya
dc.rights
<a href="http://creativecommons.org/licenses/by-nc-nd/3.0/es/">http://creativecommons.org/licenses/by-nc-nd/3.0/es/</a>
dc.subject
Named Entitites
dc.subject
automatic acquisition
dc.subject
nombres de entidades
dc.subject
adquisición automática
dc.subject
noms d'entitats
dc.subject
adquisició automàtica
dc.subject
Open source software
dc.subject
Machine translating
dc.subject
Computational linguistics
dc.subject
Programari lliure
dc.subject
Traducció automàtica
dc.subject
Lingüística computacional
dc.subject
Software libre
dc.subject
Traducción automática
dc.subject
Lingüística computacional
dc.title
Automatic acquisition of Named Entities for Rule-Based Machine Translation
dc.type
info:eu-repo/semantics/conferenceObject


Files in this item

FilesSizeFormatView

There are no files associated with this item.