An Italian to Catalan RBMT system reusing data from existing language pairs

Other authors

International Workshop on Free/Open-Source Rule-Based Machine Translation (2nd : 2011 : Barcelona)

Publication date

2010-12-20T17:16:47Z

2010-12-20T17:16:47Z

2011-01-20



Abstract

This paper presents an Italian to Catalan RBMT system automatically built by combining the linguistic data of the existing pairs Spanish-Catalan and Spanish-Italian. A lightweight manual postprocessing is carried out in order to fix inconsistencies in the automatically derived dictionaries and to add very frequent words that are missing according to a corpus analysis. The system is evaluated on the KDE4 corpus and outperforms Google Translate by approximately ten absolute points in terms of both TER and GTM.


Aquest article presenta un sistema de traducció automàtica basat en regles de l'italià al català construït automàticament combinant les dades lingüístiques dels parells espanyol-català i espanyol-italià existents. Es duu a terme un postprocessament manual superficial per a corregir incoherències en els diccionaris derivats automàticament i per a afegir-hi paraules molt freqüents que no hi són d'acord amb una anàlisi del corpus. El sistema s'avalua en el corpus KDE4 i supera Google Translate aproximadament per deu punts absoluts tant pel que fa al TER (índex d'edició de traducció) com pel que fa al GTM (mètode de traducció gramàtica).


Este artículo presenta un sistema de traducción automática basado en reglas del italiano al catalán construido mediante la combinación de datos lingüísticos de los pares existentes español-catalán y español-italiano. Se lleva a cabo un postprocesamiento manual superficial para corregir incoherencias en los diccionarios derivados automáticamente y para añadir palabras muy frecuentes que no están en ellos según un análisis del corpus. El sistema se evalúa en el corpus KDE4 y supera a Google Translate aproximadamente por diez puntos absolutos tanto por lo que respecta al TER (índice de edición de traducción) como por lo que respecta al GTM (método de traducción gramática).

Document Type

Object of conference

Language

English

Publisher

Universitat Oberta de Catalunya

Recommended citation

Toral, Antonio; Ginestí-Rosell, Mireia; Tyers, Francis (2011, January). "An Italian to Catalan RBMT system reusing data from existing language pairs". Proceedings of the Second International Workshop on Free/Open-Source Rule-Based Machine Translation (2011: Barcelona). <http://hdl.handle.net/10609/5649>

978-84-693-9517-2