Paralelización del corpus sensem: español-catalán

Parallelization of the sensem corpus: spanish and catalan

Publication date

2016-02-15T19:06:57Z

2016-02-15T19:06:57Z

2011-01-01

2016-02-15T19:06:57Z



Abstract

En ese trabajo presentamos un corpus paralelo para las lenguas española y catalana, SenSem. Se trata de un corpus paralelo anotado a distintos niveles lingüísticos (morfológico, sintáctico y semántico) y que abarca distintas unidades de información (palabra, sintagma y oración). Uno de los valores principales de este recurso es que ha supuesto la creación del primer corpus del catalán con información relativa a aspectos de la semántica oracional, como la aspectualidad y la modalidad. El recurso se ha creado traduciendo al catalán el corpus ya creado para el español en un proyecto anterior y manteniendo los vínculos entre ambas lenguas entre las distintas unidades de información mencionadas. Además, se ha heredado la anotación que se llevó a cabo para el español, corrigiendo cuando ha sido necesario la información para el catalán.

Document Type

Article


publishedVersion

Language

Spanish

Publisher

Universitat de Barcelona

Related items

Reproducció del document publicat a: http://revistes.ub.edu/index.php/AFEL/index

Anuari de Filologia, 2012, num. 1, p. 167-193

Recommended citation

This citation was generated automatically.

Rights

cc-by (c) Vázquez et al., 2011

https://creativecommons.org/licenses/by/3.0/deed.es_ES

This item appears in the following Collection(s)