Corpus paralelo

texto que se coloca junto a su traducción o traducciones From Wikipedia, the free encyclopedia

El corpus paralelo, también llamado texto paralelo; es un recurso lingüístico formado por textos originales en una lengua y las traducciones de ese mismo texto en una o varias lenguas.[1] Estos textos se alinean para que el segmento traducido se corresponda con el segmento original. La alineación suele ser a nivel oracional, pero también a nivel de párrafo o palabra. Las memorias de traducción facilitan la creación de corpus paralelos porque son almacenes compuestos de textos originales en una lengua alineados con su traducción en otras. Estos corpus no deben confundirse con los corpus comparables o comparativos, que consisten en textos originales en diferentes lenguas, pero que no están traducidos.[2]

El corpus paralelo puede ser bilingüe, formado por dos lenguas, o multilingüe, que incluye más de dos lenguas. Por ejemplo, la Universidad de Santiago de Compostela ha impulsado el proyecto PaCorES Project para preparar una colección de corpus paralelos bilingües donde el español sea la lengua principal. En total, se han compilado cuatro corpus paralelos en las siguientes combinaciones lingüísticas: alemán-español, inglés-español, francés-español y chino-español.[3] Por su parte, las instituciones internacionales han compilado diferentes corpus paralelos multilingües. La Unión Europea ha creado corpus como Europarl,[4][5] DGT-Translation Memory[6] o EurLex a partir de las actas y la documentación oficial del Parlamento Europeo. Estos corpus incluyen todas las lenguas oficiales de la UE. La Organización de las Naciones Unidas también ha compilado un corpus paralelo propio que incluye las grabaciones de las sesiones parlamentarias en seis idiomas: inglés, francés, español, ruso, chino y árabe.[7]

Se utiliza en los estudios de traducción, en especial en la traducción automática y en el desarrollo de sistemas de traducción estadística y neuronal. Además, es de utilidad en la enseñanza de una lengua o en investigaciones lingüísticas.

Véase también

Referencias

Bibliografía

Related Articles

Wikiwand AI