To access the full text documents, please follow this link: http://hdl.handle.net/2117/18275

Correcting input noise in SMT as a char-based translation problem
Formiga Fanals, Lluís; Rodríguez Fonollosa, José Adrián
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions; Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
Misspelled words have a direct impact on the final quality obtained by Statistical Machine Translation (SMT) systems as the input becomes noisy and unpredictable. This paper presents some improvement strategies for translating real-life noisy input. The proposed strategies are based on a preprocessing step consisting in a character-based translator.
Peer Reviewed
Àrees temàtiques de la UPC::Ensenyament i aprenentatge::Aprenentatge de llengües
Àrees temàtiques de la UPC::Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic
Natural language processing (Computer science)
Signal theory (Telecommunication)
Tractament del llenguatge natural (Informàtica)
Senyal, Teoria del (Telecomunicació)
Attribution-NonCommercial-NoDerivs 3.0 Spain
http://creativecommons.org/licenses/by-nc-nd/3.0/es/
Article - Draft
Report
         

Show full item record

Related documents

Other documents of the same author

Formiga Fanals, Lluís; Henríquez Quintana, Carlos Alberto; Hernández Huerta, Adolfo; Mariño Acebal, José Bernardo; Monte Moreno, Enrique; Rodríguez Fonollosa, José Adrián
Formiga Fanals, Lluís; Rodríguez Fonollosa, José Adrián
Formiga Fanals, Lluís; González Bermúdez, Meritxell; Barrón-Cedeño, Alberto; Rodríguez Fonollosa, José Adrián; Màrquez Villodre, Lluís
Formiga Fanals, Lluís; Ruiz Costa-Jussà, Marta; Mariño Acebal, José Bernardo; Rodríguez Fonollosa, José Adrián; Barrón-Cedeño, Alberto; Màrquez Villodre, Lluís
 

Coordination

 

Supporters