Para acceder a los documentos con el texto completo, por favor, siga el siguiente enlace: http://hdl.handle.net/2099.1/19031

Machine Translation for Chinese-Spanish: Experimenting with online Statistical and Rule-Based Paradigms;
Traducción automática "online" entre chino y castellano: Experimentando con los paradigmas estadístico y por reglas;
Traducció automàtica "online" entre xinès i castellà: Experimentant amb els paradigmes estadístic i per regles
Centelles Sabater, Jordi
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions; Ruiz Costa-Jussà, Marta
Traducció automàtica estadística en xinès-castellà.
[ANGLÈS] Due to the overwhelming increment of information in multiple languages, Machine Translation has become an essential application in our lives. Proof of this are the continuous investments made by technology companies to develop new and improved translation systems. However, translation between distant language pairs such as Chinese and Spanish, which are commonly used in both business and daily life, have been seldom addressed from a research point of view. This project focuses on online translation between Chinese and Spanish. Initially, we present a brief introduction to the field of Machine Translation, and a quick overview to its history and its main approaches. After that, we introduce Statistical Machine Translation, which is the translation paradigm behind our online system. We explain the mathematical basis and the structure of the models. Likewise, we present the evaluation framework used to evaluate our system. Next, we describe how the online system has been built, which allows for translating either from a web-based interface or from two mobile applications (one for Android and one for iOS). Also, we explain how special methods for inputting Chinese and Latin characters are included in the web-based interface and the application. Then, we present the implementation details regarding our statistical translation system. We cover both the description of the corpora used to train the system and the quality assessment of the resulting translations. Finally, we briefly explore the paradigm of rule-based machine translation (also between Chinese and Spanish). We explain the theory of this translation system and we describe the construction of a toy system in order to illustrate how this kind of systems works. This last task is the basis for an open-source rule-based machine translation system that is being developed within the framework of the Google Summer of Code 2013.
[CASTELLÀ] Debido al imparable crecimiento de la información en múltiples idiomas, la traducción automática se ha convertido en una aplicación necesaria en nuestro día a día. Así lo demuestran las continuas inversiones que empresas tecnológicas llevan a cabo para desarrollar nuevos y mejores sistemas de traducción. Pares de lenguas tales como el chino y el castellano son frecuentemente utilizados tanto en los negocios como en la vida cotidiana. Este proyecto se centra en la traducción "online" entre chino y castellano. Inicialmente, se hace una breve introducción al campo de la traducción automática, un repaso sobre los principales puntos de su historia y se explican los principales enfoques de traducción automática. A continuación, se introduce la traducción automática estadística ya que es el paradigma de traducción que hay detrás de nuestro sistema "online". Se explica teóricamente cuáles son sus bases matemáticas y a partir de qué modelos se crea un traductor automático estadístico. Asimismo, también se explica teóricamente cómo funciona un método de evaluación para este tipo de traductores que, más adelante en el proyecto, será utilizado para evaluar nuestro propio traductor. En la parte siguiente se describe cómo está construido el sistema "online" que nos permite traducir tanto desde una página web como desde dos aplicaciones móviles (una para sistemas Android y la otra para sistemas iOS). También, se explica cómo han sido incluidos unos métodos especiales de escritura tanto de caracteres chinos como de caracteres latinos para la web y las aplicaciones. Posteriormente, presentamos la parte de evaluación del sistema de traducción estadístico que nos da información tanto de la calidad de las traducciones como de los corpus lingüísticos utilizados para entrenar el sistema. Finalmente, cambiamos de paradigma para centrarnos en la traducción basada en reglas también entre el chino y el castellano. Se explica de forma teórica como funciona este nuevo sistema de traducción y se construye un sistema sencillo de muestra para enseñar cómo se estructura este otro tipo de traductor. Esta última tarea constituye las bases de un sistema de traducción por reglas de código abierto que se desarrolla en el contexto del Google Summer of Code 2013.
[CATALÀ] A causa de l’imparable creixement de la informació en múltiples idiomes, la traducció automàtica ha esdevingut una aplicació necessària en el nostre dia a dia. Així ho demostren les contínues inversions que empreses tecnològiques duen a terme per desenvolupar nous i millors sistemes de traducció. Parelles de llengües tals com el xinès i el castellà són freqüentment utilitzades tant en els negocis com en la vida quotidiana. Aquest projecte se centra en la traducció online entre xinès i castellà. Inicialment, es fa una breu introducció al camp de la traducció automàtica, un repàs sobre els principals punts de la seva història i s’expliquen els principals enfocaments de traducció automàtica que hi ha. A continuació, s’introdueix la traducció automàtica estadística ja que és el paradigma de traductor que hi ha darrere del nostre sistema online. S’explica teòricament quines són les seves bases matemàtiques i a partir de quins models es crea un traductor automàtic estadístic. Així mateix, també s’explica teòricament com funciona un mètode d’avaluació per aquest tipus de traductors que, més endavant en el projecte, serà utilitzat per avaluar el nostre propi traductor. En la part següent es descriu com està construït el sistema online que ens permet traduir tant des d’una pàgina web com des de dues aplicacions mòbils (una per a sistemes Android i l’altra per a sistemes iOS). Així mateix, s’explica com han estat inclosos uns mètodes especials d’escriptura tant de caràcters xinesos com de caràcters llatins per a la web i les aplicacions. Posteriorment, presentem la part d’avaluació del sistema de traducció estadístic que ens dóna informació tant de la qualitat de les traduccions com dels corpus lingüístics utilitzats per entrenar el sistema. Finalment, canviem de paradigma per centrar-nos en la traducció basada en regles també entre xinès i castellà. S'explica de forma teòrica com funciona aquest nou sistema de traducció i es construeix un sistema senzill de mostra per ensenyar com s’estructura aquest altre tipus de traductor. Aquesta última tasca constitueix les bases d’un sistema de traducció per regles de codi obert que es desenvolupa en el context del Google Summer of Code 2013.
Àrees temàtiques de la UPC::Enginyeria de la telecomunicació
Machine translating
Computer programming
Machine Translation
mobile applications
web interface
Chinese
Spanish
Traducción automática
aplicaciones móviles
interfície web
programación
Web
Traducció automàtica
Programació (Ordinadors)
S'autoritza la difusió de l'obra mitjançant la llicència Creative Commons o similar 'Reconeixement-NoComercial- SenseObraDerivada'
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
info:eu-repo/semantics/bachelorThesis
Universitat Politècnica de Catalunya
         

Mostrar el registro completo del ítem