miércoles, 21 de noviembre de 2012

¡Creando nuestros propios proyectos!

Creando nuestros propios proyectos!

TMX
El día anterior habíamos puesto en paralelo un texto sobre el Iphone. TMX tiene la ventaja de aceptar diferentes formatos de texto.
Las informaciones adicionales se muestran entre paréntesis angulares
La información que interesa al usuario se muestra desde la etiqueta "body", que encierra todo el cuerpo del texto. Al final del cuerpo encontramos "/body". Sumado a estas etiquetas simples, existen etiquetas complejas, como una que contenga:
 TU (translation unit), el número de unidad, TV (variantes).

En resumen, TMX es una forma de agrupar y representar información alineada.




OMEGA T
Es una herramientas de memoria de traducción libre. En su página web podemos encontrar sus instrucciones y descargárnoslo. Tiene sus limitaciones, pero trata de compensarlas con otras herramientas de código abierto. De esta forma busca sustituir a programas de pago. Permite trabajar con bastante fluidez y estabilidad, y esta actualizado por un amplio grupo de profesionales.Por ejemplo, los formatos de texto que admite se van ampliando progresivamente.
Una de sus principales facilidades es una pequeña guía rápida inicial. Conviene leerla para familiarizarse con la plataforma y sus conceptos esenciales: como el de proyecto (conjuntos de archivos empleados para una labor, pero que funcionan como una única "unidad" de trabajo en nuestra traducción).

Usar Omega T



1. Nos aseguramos de que nuestros textos se encuentran en un formato que reconozca nuestro programa, modificándolo si es necesario.
2.Volvemos al programa  y abrimos un nuevo documento
3.Seleccionar idiomas origen y meta.
4.Selleccionar alinear por frases (si no lo hacemos trabajará con párrafos completos)
5.Al crear el proyecto, se generan distintas carpetas:


  • carpetas source para lengua origen
  • carpetas tm para las memorias de traducción de las que dispongamos
  • carpetas glossary para introducir el glosario de trabajo que vamos a manejar
  • carpetas dictionary para almacenar diccionario de lengua
  • carpetas target para el almacenamiento de los archivos finales, ya traducido

6. Seleccionar la opción "importar archivos de origen" Se nos mostrará el recuento de palabras.
7. Seleccionar el grado de similitud deseable para traducir segmentos en función de qué palabras son coincidentes.
8.Comenzar a traducir solapando el texto meta sobre el texto origen en Omega T. Conviene tener el original disponible para posibles consultas.
9.Las etiquetas que van apareciendo hacen referencia a aspectos de codificación necesarios para que el archivo final tenga un formato adecuado. Hay ds tipos: las de formatos general (no visibles) y las que afectan a parte del texto (que aparecen).
10.Introducir nuestro archivo en la carpeta TM
11.El proyecto se guarda. Una vez realizada la traducción, se pueden generar documentos finales desde el mismo proyecto:
12. ir a documentos finales listos. Nuestro documento final aparece en la carpeta Target

CÓMO CREAR UN GLOSARIO
1.Abrimos cualquier tipo de editos, como el Blog de notas o el Notepad
2.Introducimos y su traducción dividido por un tabulador
3.Guardamos el glosario en la carpeta Glossary con el nombre que decidamos darle(la extensión debe ser tab)
4. Regeneramos el proyecto con F5


El 1, 2, 3 DE OMEGA T: Trucos útiles:
  • Traducir  (opciones-tab) o dobleclick en el segmento) Podemos habilitar "Consejos para traducción" y aparecerán en azul los términos recogidos por el glosario.
  • En opciones-visión podemos decidir si nos aparece el texto origen o no.
  • Podemos revisar la ortografía.
  • Podemos validar las etiquetas (es muy conveniente).
  • En estadísticas se nos plantea un recuento de palabras, el total de palabras a traducir, el total de palabras pendientes, de palabras únicas, y lo mismo con segmentos, caracteres, etc.

VENTAJAS


  1. -Mayor rapidez, especialmente en palabras muy recurrentes.
  2. -Al traducir entre varios profesionales, se garantiza que todos los miembros utilizan la misma terminología.
  3. -Las las coincidencias exactas se pueden introducir directamente en la edicion con ctrl1, 2, 3.
  4. -Integramos en un solo entorno todo el material que necesitaremos en una traducción.

CONCLUSIONES

  • Habremos ganado mucho tiempo en el formato y podremos devolverle al cliente prácticamente la misma información que nos ha enviado.
    • De esta forma es muchísimo más fácil aceptar encargos de traducción que de otra forma rechazaríamos. Hacer una localización de una Web directamente es extremadamente complicado.
    • Ver la eficacia de Omega T a través de una traducción es la mejor forma de apreciar estas informaciones.


Algunas de las herramientas del traductor


Incorporo en esta entrada una breve descripción de las herramientas más útiles que conviene tener en "el cajón del traductor" Están basadas en un glosario en inglés de extensión PDF de Moodle, en la experiencia propia y en algunos datos de información complementaria de la Red.

 AlgUnAs HERRAMIENTAS DE TRADUCCIÓN


                          ESENCIALES

HERRAMIENTAS ACTIVAS DE IDENTIFICACIÓN DE TERMINOLOGÍA

Estas herramientas analizan de manera automático textos en formato electrónico con el fin de identificar en ellos términos que se incluyan en bases de datos terminológicas. Pueden destacar los términos encontrados dentro de un texto, así como proponer términos equivalentes incluidos en la base de datos o reemplazarlos dentro del texto. esta herramienta suele incluirse en los programas de creación de memorias de traducción. 
Ejemplo: Termbase Agent, en MultitTrans.

GENERADORES DE CONCORDANCIAS

Esta herramienta permite a los traductores observar la incidencia de una secuencia de caracteres en bitextos. de esta forma, los profesionales pueden comparar textos, evaluar traducciones en potencia, y considerar cuáles son las piezas léxicas y estructuras sintácticas más adecuadas en cada caso.
Ejemplo: BeeText Find, AntConc

ALINEADORES TEXTUALES


Los alineadores son programas que a partir de material textual en dos lenguas diferentes enlazan segmentos más pequeños de una lengua con la otra, con el fin de crear o alimentar las memorias de traducción. Estas herramientas normalmente se hallan integradas en los sistemas de traducción asistida.
Dos herramientas muy utilizadas para esto son: WinAlign (Trados) +Align (Wordfast).

LOS CORPUS


Los corpus son conjuntos de textos electrónico recopilados para el estudio de un determinado campo del conocimiento. Por lo general, estas compilaciones se realizan para investigar sobre las características del lenguaje o para servir como una muestra de este dentro de un determniado ámbito. Estas coleccciones textuales permiten encontrar estructuras y colocaciones recurrentes. Los corpus comparables (monolingües) emplearan alineadores comparables, mientras que los paralelos (bilingües) requerirán de alneadores bitexto. 
Ejemplo: CREA (RAE) o British National Corpus.

DICCIONARIOS ELECTRÓNICOS

los diccionarios electrónicos son una alternativa cómoda (y ligera) a los diccionarios en papel. Se pueden encontrar en distintos soportes (web, CDRom, FlashDisk). Su variedad es tan amplia como la de sus homólogos físicos, aunque a veces su edición y revisión no está tan cuidada o revisada. Ej.  El diccionario monolingüe Reverso.

HERRAMIENTAS DE LOCALIZACIÓN

La localización es el conjunto de tareas involucradas en la traducción y adaptación de un portal virtual o cualquier otro programa de Software o producto que sea de interés para un determinado sector de usuarios. Debido a su complejidad, es frecuente que este proceso involucre a varios profesionales. Se han creado numerosas tareas para facilitarles este trabajo: gestores del flujo de trabajo, contadores de palabras, alineadores y separadores textuales, etc.
Ejemplos: Catalyst, Passolo

SISTEMAS DE TRADUCCIÓN AUTOMÁTICA

Este tipo de herramientas difieren de las otras en que el agente "creador" del nuevo material textual será la tecnología, no el profesional. El profesional jugará un papel clave en la "post-edición", en la revisión de los textos, además de en la programación del sistema y sus posibles ajustes o modificaciones. Son especialmente útiles para la adquisición del sentido general sel texto, pero no son apropiados para la publicación formal de textos complejos.Estas herramientas se sirven de distinas técnicas, como los ejemplos reales o la estadística.
Ejemplo: sistema de traducción automática de Reverso.

SISTEMAS DE CONCORDANCIA MONOLINGÜES

Son herramientas que se emplean paara analizar los corpus. Buscan coincidencias en secuencias mediante sistemas como los operadores Boleanos. Muchos devuelven contenidos recuperados mediante índices KWIC (key Words In Context). También pueden incorporar otras aplicaciones de análisis de corpus, como la ordenación de palabras por su orden de frecuencia. 
Ejemplo: WebCorp



MOTORES DE BÚSQUEDA
Además del archiconocido Google, existe una gran variedad de motores de búsqueda tanto generales como temáticos. Estos buscadores localizan páginas web que contengas palabras se ajusten a las seleccionadas por el usuario. El empleo de palabras clave les ha permitido consolidarse como uno de los sistemas de acceso a la información más sencillos y eficaces. Por otra parte, los metabuscadores, como Dogpile, nos permiten acceder a los resultados de varios motores de búsqueda simultáneamente.
Ejemplo: Blacke (igual que Google pero con el fondo negro para ahorrar energía).

BASES DE DATOS TERMINOLÓGICAS
Las bases de datos terminológicas son especialmente útiles para la redacción y la traducción de lenguaje técnico o especializado. Normalmente, se centran en un campo concreto y desarrollan la terminología que se engloba en este. Sus bases de datos suelen ser bilingües o plurilingües y, por lo general, está, bien estructurados. Una de sus principales desventajas es que su tamaño hace que en ocasiones los términos no estén adecuadamente actualizados.
Ejemplo: IATE (la base de datos de la UE)

EXTRACTORES DE TÉRMINOS
Son herramientas informáticas destinadas al análisis de  textos en formato electrónicos y seleccionar posibles piezas léxicas para identificarlas como términos. No son herramientas completamente exactas, por lo que es conveniente la verificación de sus resultados.
Ejemplo: TermoStat

SISTEMAS DE GESTIÓN TERMINOLÓGICA
Emplean mecanismos similares a los sistemas comunes de gestión de bases de datos, pero estos están diseñados específicamente para ayudar al traductor y otros profesionales a gestionar, almacenar y recuperar datos terminológicos como dominios, equivalentes, contextos, etc. Son una alternativa más completa y avanzada a las herramientas de gestión y procesamiento de textos que ofrece Office. Se puede combinar su uso con el de otras herramientas de traducción para elaborar memorias de traducción con gran eficacia. Se diferencian de las grandes bases de datos terminológicas en que su uso es a nivel individual o grupal.
Ejemplo: BeeText Term 


S. de traducción asistida, memorias de traducción, corpus


Creación las memorias de traducción a través de los programas de traducción asistida
En la clase de algunas de nuestras compañeras nos han expuesto de una forma bastante sencilla y práctica las principales memorias de traducción y algunas de sus características más significativas. Al llegar al (tal vez sobrevalorado)  Trados la exposición se complicó-parece que este programa es tan complejo y confuso que incluso con notable esfuerzo resulta difícil describirlo-.
En primer lugar, se realizó una breve diferenciación entre la traducción automática (sin intervención creadora humana), y la traducción asistida (en la que la tecnología es una herramienta al servicio de un profesional).
Los programas de traducción asistida generan un inmenso debate que se solapa con la información objetiva sobre ellos en Internet. Para reflexionar sobre ellos es necesario conocer las aportaciones positivas y negativas de su uso:
Ventajas


1.-Recuperación de la información.
2.-Fijación.
3.-Rapidez.
4.-Segmentación
5.-Búsqueda contextual
6.-aprendizaje
7.-tipos de archivos (admiten muchos formatos)
8.-Modificaciones globales (como buscar y reemplazar más o menos)
9. facilidad de corrección
10.-Glosarios
11.- Gran capacidad de memoria


Desventajas
1.-Abuso: uso indiscriminado, repetición de errores
2.-Segmentación: a veces tendremos q alterar el orden, no hay correspondencia
3-.Traducción automática: la máquina sugerirá errores
4-.Aprendizajes: algunos programas son complejos o un programa cuenta con demasiadas aplicaciones diferentes.
 Las memorias de traducción se realizan a través de programas para la traducción asistida tales como:


*      Trados
*      Déjavú (su interfaz es similar a Trados)
*      Transit
*      Translation Manager (IBM)
*      Wordfast (interesante pos su sencillez)
*      Metatexis



Cada uno de estos programas, como es de esperar, presenta un perfil diferente. Creo que no es relevante hacer un comentario valorativo de ellos porque su utilidad y calidad dependerá del uso concreto que le queramos dar. Por ejemplo, si buscamos un programa que nos permita trabajar con distintos formatos de texto tal vez optemos por Metatexis, pero en un currículum vitae en el que busquemos mostrar nuestra profesionalidad puede sernos de provecho afirmar conocimientos de Trados a nivel de usuario.
Veamos una serie de sencillas instrucciones para abrir un nuevo texto en Trados:
v  Inicio-abrir documento-seleccionar los idiomas de origen y destino de nuestra traducción-crear-nueva memoria de traducción basada en archivos-denominación de nuestra memoria-nos aparecerá el texto origen- el texto nos aparece segmentado y vamos añadiendo en la casilla derecha la traducción (podemos pegarlo desde un documento ya existente)-para verlo tras ser creado iremos a vista de proyectos.


FINALMENTE, PARA CREAR NUESTROS CORPUS PARALELOS, ES FUNDAMENTAL SABER QUE…
*      Las memorias de traducción se generan a través de corpus paralelos
*      Una memoria de traducción requiere de texto origen, tm, de un sistema de segmentación de textos y alineador que sepa detectar la correspondencia entre segmentos.
*      En la memoria de traducción los archivos están fusionados segmento a segmento, siendo estos bilingües.






§  LOS CORPUS NOS SIRVEN:
§  Para crear memorias de traducción
§  Para tener un diccionario específico
§  Para recuperar palabras ya traducidas en su momento que nos resultaron complejas