International Workshop on Free/Open-Source Rule-Based Machine Translation (2nd : 2011 : Barcelona)
2010-12-20T17:16:47Z
2010-12-20T17:16:47Z
2011-01-20
This paper presents an Italian to Catalan RBMT system automatically built by combining the linguistic data of the existing pairs Spanish-Catalan and Spanish-Italian. A lightweight manual postprocessing is carried out in order to fix inconsistencies in the automatically derived dictionaries and to add very frequent words that are missing according to a corpus analysis. The system is evaluated on the KDE4 corpus and outperforms Google Translate by approximately ten absolute points in terms of both TER and GTM.
Aquest article presenta un sistema de traducció automàtica basat en regles de l'italià al català construït automàticament combinant les dades lingüístiques dels parells espanyol-català i espanyol-italià existents. Es duu a terme un postprocessament manual superficial per a corregir incoherències en els diccionaris derivats automàticament i per a afegir-hi paraules molt freqüents que no hi són d'acord amb una anàlisi del corpus. El sistema s'avalua en el corpus KDE4 i supera Google Translate aproximadament per deu punts absoluts tant pel que fa al TER (índex d'edició de traducció) com pel que fa al GTM (mètode de traducció gramàtica).
Este artículo presenta un sistema de traducción automática basado en reglas del italiano al catalán construido mediante la combinación de datos lingüísticos de los pares existentes español-catalán y español-italiano. Se lleva a cabo un postprocesamiento manual superficial para corregir incoherencias en los diccionarios derivados automáticamente y para añadir palabras muy frecuentes que no están en ellos según un análisis del corpus. El sistema se evalúa en el corpus KDE4 y supera a Google Translate aproximadamente por diez puntos absolutos tanto por lo que respecta al TER (índice de edición de traducción) como por lo que respecta al GTM (método de traducción gramática).
Object of conference
English
Italian to Catalan; automatically built; italià-català; construït automàticament; italiano-catalán; construido automáticamente; Open source software; Machine translating; Computational linguistics; Programari lliure; Traducció automàtica; Lingüística computacional; Software libre; Traducción automática; Lingüística computacional
Universitat Oberta de Catalunya
Toral, Antonio; Ginestí-Rosell, Mireia; Tyers, Francis (2011, January). "An Italian to Catalan RBMT system reusing data from existing language pairs". Proceedings of the Second International Workshop on Free/Open-Source Rule-Based Machine Translation (2011: Barcelona). <http://hdl.handle.net/10609/5649>
978-84-693-9517-2