Archivo de la etiqueta: CAT

III Congreso Cotich y I seminario Chile-Japón

Solo una notita rápida para mantenerlos informados acerca de dos eventos relacionados con traducción que tendrán lugar dentro de poco uno y dentro de unos meses el otro.

Ambos me tendrán participando de alguna u otra forma, así que ya sabe mi club de fans dónde me puede encontrar (claro).

El primero es el III congreso del Cotich, el colegio de traductores e Intérpretes de Chile, donde haré un pequeño taller sobre Wordfast classic.

El segundo, el I Seminario Internacional Chile-Japón donde hablaré (espero) algo sobre la traducción del japonés (todavía no sé qué).

Ambos eventos se realizarán en la Universidad de Santiago de Chile.

Aquí la info:

III congreso del Cotich

http://cotich.wordpress.com/2013/11/04/iii-congreso-de-traduccion-e-interpretacion-del-colegio-de-traductores-e-interpretes-de-chile-a-g/

 

Primer Seminario Internacional Chile -Japón

Español
http://www.globalcompetences.org/english/seminario2014en/seminario2014sp/

Japonés
http://www.globalcompetences.org/english/seminario2014en/seminario2014jp/

Inglés
http://www.globalcompetences.org/english/seminario2014en/

 

Deja un comentario

Archivado bajo CAT, Traducción

Los famosos descuentos por repetición

No sé si sea sólo una realidad fortuita o parte de un esfuerzo concertado de la industria por aprovecharse de los pobres traductores, pero la realidad es que si bien en teoría el uso herramientas TAC y sus memorias de traducción (MT) pueden ser un gran aliado del traductor, muchas veces terminan siendo un enemigo que lo obliga a trabajar por menos dinero del que le corresponde.

La mecánica es simple: la agencia entrega al traductor los textos que debe traducir y una MT que debe utilizar. La traducción realizada se analiza en comparación con las porciones de texto que ya están presentes en la memoria y según el resultado, se paga al traductor la tarifa completa por unidades nuevas, una tarifa reducida por unidades con determinado porcentaje de analogía y, a veces,  nada o una cantidad ínfima por las unidades completamente repetidas.

La lógica del mecanismo es impecable, pero ahí está la falla. El lenguaje y la traducción no siempre responden a la lógica. La premisa que sigue el razonamiento de las agencias es que una misma unidad no debería tener más de una traducción, por lo que las traducciones anteriores de determinados pasajes deberían poder reciclarse en caso de surja un texto igual. Pero este razonamiento no calza con la realidad. La traducción depende del contexto situacional del enunciado y del propósito de la traducción. Un ejemplo sencillo es el siguiente: 男 puede traducirse como “hombre, varón o macho”, según sea el caso, o como “masculino”, por ejemplo en la categoría “sexo”, de la sección “Datos personales” de una encuesta. Por lo tanto, aunque la máquina nos diga que hay un 100% de analogía, como traductores debemos estar pendientes de esas sutilezas. Es por eso que considero injusta la tarificación que practican muchas agencias. Lo mismo pasa con analogías cercanas al 80% 0 90% como en el caso de

社会がつぶれた  La sociedad colapsó

y

会社がつぶれた    La empresa quebró

donde con los mismos caracteres se escriben oraciones diferentes, pero tendrían una similitud de 84% según Wordfast Classic. ¿Por qué deberíamos recibir un pago descontado a cuenta del nivel de analogía, cuando hay que hacer el trabajo completo?

Claro, hay muchas veces en que el uso de las memorias aumenta la productividad y nos permite producir más rápido, sobre todo cuando las repeticiones son eso, repeticiones. Pero saber cuándo lo son y cuándo no, exige del profesionalismo y del tiempo del traductor.  Y eso vale plata, señores.

Afortunadamente en el mundo de las traducciones del japonés al español he tenido pocas experiencias de este tipo (aunque ya empiezan algunos a preguntar o imponer sus condiciones). Pero para los colegas que trabajan más con inglés, es pan de cada día.  Sería conveniente buscar ejemplos similares en diferentes pares de lenguas, para combatir esta práctica abusiva de las agencias…cuando se puede, pues por lo general es una batalla perdida. Otra alternativa menos saludable sería “no mirar para nada” las de 100% si no se pagan, pero con eso, la calidad final de la traducción terminará pagando los platos rotos.

13 comentarios

Archivado bajo CAT, Traducción

Contar palabras (2a parte)

Y seguimos entonces con esto del conteo. La idea era contarles de aplicaciones de pago, como Anycount, que sirven para el conteo en formatos distintos a Word, se pueden usar en varios archivos de forma simultánea y entregan un informe bien bonito, ordenado y detallado que podemos incluir en nuestra cotización. No obstante, gracias al comentario de Pablo Beauvier me enteré de la existencia de un pequeño programilla gratuito, que hace precisamente lo mismo, con la gracia de que incluso distingue entre letras asiáticas y occidentales. Se trata nada más y nada menos que de Count Anything. Hasta donde he podido probar, funciona bastante bien con archivos de Word, Excel, PowerPoint , HTML y PDF, aunque admite otros formatos que no he probado aún. (Tarea para el que quiera hacerlo).

Resultados con Count Anything

Nótese que distinque tipos de caracteres y permite contar archivos de distinto formato al mismo tiempo

La única desventaja que le veo frente a Anycount, es que no se puede configurar lo que queremos que cuente o ignore. Por ejemplo, a veces nos piden traducir una presentación en PowerPoint, pero ignorar las notas del orador que incluyen algunas diapositivas.  Anycount nos da la opción de ignorar las notas. Count Anything, no. Pero a caballo regalado, no le mires la configuración.

Otra cosa con respecto a los archivos de PowerPoint:  Al hacer clic derecho en el archivo e ir a Propiedades > Estadísticas veremos una línea donde figura un número que corresponde a la cantidad de palabras.  A partir de mi experiencia, iba a decir que no conviene fiarse de ese número porque suele ser inferior a la realidad, pero aparentemente a partir de Office 2007 resulta más preciso. Al menos con las pocas pruebas que acabo de hacer. Así que pueden sacar sus propias conclusiones.

¿Y qué pasa con los archivos PDF?

Primero, tenemos que entender que los hay de varios tipos:

  1. Los bien hechos o hechos “como la gente” de manera digital, en la que el texto se puede seleccionar y por lo tanto, contar.
  2. Los “hechos con los pies”, que son en realidad una foto escaneada y por lo tanto, no se pueden contar las palabras de buenas a primeras. En realidad no es que estén mal hechos, sino que dependen de las limitaciones y la no disponibilidad del texto en formato digital.
  3. Los más o menos, que son el resultado del OCR de una imagen. O sea, son una foto, pero se pueden contar, aunque a veces con detalles y letras mal reconocidas.

Entonces, para el primer tipo, podemos usar la herramienta antes mencionada, o esta otra solución un poco más nerd que no requiere otros programas. Para ello, hay que pegar el siguiente código en la consola de JavaScript y ejecutarlo, (para ejecutarlo en Acrobat Reader se selecciona el código y se presiona control y enter al mismo tiempo… según me explican, yo lo probé con otro lector de PDF)

var cnt=0;

for (var p = 0; p < this.numPages; p++)

cnt += getPageNumWords(p);

console.println(“There are ” + cnt + ” words in this doc.”);

Para que les quede más claro, les dejo unas capturas de pantalla que me mandó la personita que me lo enseñó.

paso 1 paso 2 paso 3

Y creo que eso sería lo que iba a contarles. Hay otras herramientas (por ejemplo, Practicount & Invoice) pero no la conozco. Entiendo que presenta más funcionalidades y configurabilidad que podría resultar muy útil.

Ah, otra cosa: Anycount, viene incluido como función dentro del TO3000 del que les hablé en otra ocasión. Si lo compran  a través de este enlace, se supone que me toca comisión. No ha pasado nunca eso sí…o nadie me lee o nadie me cree. 🙂

Bonus track:

Me preguntaron por Facebook qué hacer en el caso de los hard copy,  pues nos vemos obligados  a contar a mano y perder mucho tiempo. Lamentablemente no es mucho lo que se puede hacer, pero lo que se me ocurre, sería:

1) Escanear a la mejor resolución posible.

2) Aplicar un buen OCR, por ejemplo AbbyFineReader. Si el presupuesto no alcanza para ello, probar con la herramienta que debe venir instalada con el escáner.

3) Al aplicar el OCR, centrarse solo en el texto, ya que eso es lo que estamos contando, por lo tanto, no habría que guardarlo ni como PDF escaneado ni como RTF, bastará solo con el texto sin formato.

4) Contar las palabras con Word o la herramienta de preferencia.

Como el éxito del procedimiento dependerá de la calidad del original, si el original es fax o una fotocopia de fotocopia y un texto todo reventado, saldrá más rápido y sano no contar las palabras. En ese caso, aplicar ojímetro y decirle al cliente que cobras N por x cantidad de palabras, y que calculas que saldrá y veces esa cantidad.  Sorry y gomen, Sole, pero eso es todo lo que se me ocurre.

 

 

 

 

12 comentarios

Archivado bajo CAT, Traducción

Capacitación en Wordfast Classic

Paciencia, ya vendrán más entradas relacionadas con el japonés y la traducción. Hoy aprovecho de contarles que el viernes 5 de octubré realizaré una capacitación en línea acerca de Wordfast Classic.  Supongo que ya se habrán dado cuenta de que es  una de mis herramientas CAT favoritas, tanto por su sencillez como por su filosofía comercial.  El cursillo está dentro del marco de las capacitaciones que ofrece Proz.com. Los detalles técnicos, administrativos y comerciales se pueden consultar en la página de la capacitación: Wordfast Classic, nivel inicial.  Ah, y será en castellano, porsiaca.

Deja un comentario

Archivado bajo CAT

Wordfast y las tablas

No es raro que  vayamos  felices traduciendo un documento con Wordfast y nos encontremos con una tabla:

A veces esto nos borra la sonrisa, ya que al segmentar dentro de la celda perdemos de vista el texto,  el que queda aparentemente fuera de los márgenenes de la celda, así:

Normalmente esto pasa con documentos creados a partir de archivos PDF, por lo general cuando han sido escaneados y pasados por programa de OCR.  Lo que pasa es que las tablas resultantes quedan con un alto de fila fijo, que nos impide ver el texto como querríamos. Pero no hay que asustarse, ya que hay una solución sencilla.

Simplemente, seleccionamos la tabla y con clic derecho en el mouse, nos vamos a “propiedades de tabla”. Aparecerá un cuadro como este, pero en el idioma en que tengas tu sistema operativo, obvio. Perdón por lo exótico, pero al final es lo mismo.

En ese cuadro de diálogo que le llaman (siempre lo he encontrado un nombre un poco raro…ya, se supone que a través del cuadro uno dialoga con la máquina), hay que marcar donde dice mínimo (o algo parecido, no sé que dice exactamente en español…si algún lector coopera, lo actualizamos) , et voilá, problema solucionado. Ahora podemos visualizar sin problemas el texto de la tabla en sus celdas correspondientes.

Naturalmente, una vez limpio el texto las celdas tendrán el alto correspondiente al texto que contienen. Ojalá que les sirva.

4 comentarios

Archivado bajo CAT, Traducción

TO3000

Normalmente cuando se habla del uso de la computación en el trabajo del traductor, se hace referencia a las herramientas de traducción asistida (CAT tools), a gestores terminológicos, reconocedores de voz o cualquier otro tipo de programa relacionado con aspectos lingüísticos. Sin embargo, existe una variedad de aplicaciones que no son tan famosas como las anteriores pero que pueden resultar tanto o más útiles: las programas administrativos.

Apenas empezamos a trabajar, empezamos a darnos cuenta de que hay que organizarse de algún modo:

  1. ¿Cúando debo entregar el trabajo?
  2. ¿Cuánto tengo que cobrar?
  3. ¿Qué trabajos he hecho ya para este cliente?
  4. ¿A este cliente le cobro de inmediato o a fin de mes?
  5. ¿Cuánto saldría el documento que me piden que cotice?

Al principio hacemos todo eso a mano, quizás en una agenda o con más suerte en un archivo excel escondido en algún recoveco de nuestra máquina. Con el tiempo nos damos cuenta de no nos está resultando tan bien como pensábamos, que se nos olvida cobrar, que no sabemos cuánto facturamos el mes anterior, que crear una a una nuestras facturas no es nada eficiente, etc. O sea, en el ámbito administrativo, no somos tan productivos como desearíamos, lo que nos quita tiempo para lo que realmente nos apasiona: traducir (y vivir de eso).

Ahí es donde aparecen los programas que les mencionaba recién. Para todas esas labores administrativas y tediosas, está TO3000 , de AIT software, Ucrania, creado por y para traductores. Precisamente por eso, se adapta fácilmente a nuestras necesidades. Yo lo uso desde la versión 8 y acabo de cambiarme a la versión 10.

Entre sus muchas gracias, está la creación de cotizaciones y facturas de estilo profesional con solo unos cuantos pasos. Además, incluye un software para contar palabras en distintos formatos (muy configurable), lo que ayuda una enormidad a la hora de sacar cuentas. También nos permite calcular en cosa de segundos lo que hemos ganado, lo que nos deben, lo que hemos gastado, etc. Si bien es un programa de pago, es una excelente inversión que se recuperará al poco tiempo, gracias al tiempo que nos permite ahorrar.

Aunque esta entrada suene a propaganda, soy un fiel y agradecido fan de este programa y lo recomiendo sin remordimientos. Además, el servicio técnico de post venta llega a ser emocionante: siempre responden a tiempo para solucionar cualquier inconveniente. No los entretengo más y los invito a bajar el demo…aquí.

 

4 comentarios

Archivado bajo CAT, Reseñas, Traducción

Memorias de traducción: ¿amigas o enemigas?

Para los que me echaron de menos y se dijeron, “¡pero cómo, es miércoles y no ha publicado nada!”, aquí tienen la entrada de hoy:

Una herramienta indispensable para el traductor de textos técnicos son las memorias de traducción (TM en inglés). Estas consisten en una archivo en el cual se van acumulando las traducciones que uno va haciendo y que permite reciclarlas automáticamente cuando nos encontramos con oraciones parecidas a otras que ya hemos traducido.

Por ejemplo, si nos encontramos con el texto “Tome Pin y haga Pum“, luego de haber traducido “Tome Pan y haga Pim“, la TM nos dará esta última opción (indicándonos las diferencias con colores) y nosotros los traductores sólo deberemos cambiar el Pan por el Pin y el Pim por el Pum. Así de simple. Esto significa que las TM nos ahorran tecleadas, tiempo y nos ayudan a mantener la consistencia, sin obligarnos a volver atrás para “buscar, copiar y pegar” cuando nos da la sensación de que ya hemos traducido algo parecido.

Dicho así, esto de las TM suena como una panacea para los traductores. No obstante, como con todo, tienen sus riesgos y es preciso usarlas con moderación. Quizás el riesgo principal desde el punto de vista del traductor es que la segmentación del texto original, basada en oraciones u otro criterio predefinido, influye en la traducción e imprime su estructura en el texto traducido. Es decir, nos quita la libertad de juntar, separar y reordenar oraciones según nos parezca. Ahora bien, este es un problema más achacable al usuario que al software mismo: Tenemos esa misma libertad ya que con algunos ajustes, si es posible manipular las oraciones. Desafortunadamente es muy probable que las prisas o el insuficiente dominio de la herramienta nos impidan hacerlo.

Además, como las unidades de traducción se nos presentan de manera aislada, es probable que tendamos a olvidar la utilización de los recursos lingüísticos de coherencia y cohesión propios de la lengua a la que traducimos, adoptando inconscientemente los de la lengua origen. Un tema muy frecuente al traducir del japonés y el inglés al español se da en los mecanismos de referencia. Así, si el original dice “abra la casetera, introduzca el casete en la casetera, cierre la casetera y apriete la tecla play bajo la casetera”, cosa que NO es poco frecuente en japonés o inglés, al usar MT corremos el riesgo de imprimir toda esa redundancia al español, olvidando el uso de pronombres, emisiones que permitirían una mayor naturalidad en español. Esto es menos probable que suceda si no usamos MT.

Por último está el tema de la variedad en la redacción: al presentarnos la TM las traducciones previas, tenderemos a copiarlas sin más, con lo que restaremos vitalidad y ritmo al texto. Lo más probable es que si no la usáramos, tradujéramos de manera distinta segmentos estructuralmente parecidos, y eso, de todas formas no afectaría el resultado (obviamente que depender:a del tipo de texto. Algunos necesariamente tienen que ser repetitivos, como los archivos de ayuda, a causa de las referencias cruzadas). El equilibrio entre consistencia y monotonía es bastante sutil y no hay recetas para conseguirlo.

¿Cómo solucionar estos problemas?. La respuesta es simple: utilizar el software simplemente como una herramienta que ayuda en el proceso de la traducción, y no confundirla con una varita mágica que traduce por nosotros. Siempre es posible manipular el texto final una vez que ha sido limpiado y ya no tiene ninguna relación física con la TM. ¡Pero si hago cambios ahora, no se reflejarán en la memoria! gritarán los traductores alarmados, dejando ver que ya son presas de los dictámenes del software: Así es. Los cambios no quedarán en la memoria, pero el texto final quedará mejor. Y ese es nuestro trabajo. La TM no está para esclavizarnos.

1 comentario

Archivado bajo CAT, Traducción

Across

Bueno, hace un buen tiempo ya, prometí que comentaría otra herramientas de traducción para los regalones. Así que aquí vamos, con la más bien desconocida Across. Este es un programa enorme  que, a diferencia de Wordfast Classic, no trabaja dentro de Word, sino que consiste en un entorno independiente, desde el cual los archivos traducidos son recreados, en el formato correspondiente, una vez terminados.

Cuando digo enorme, me refiero a la instalación, que duró más o menos media hora, cuando todo fue bien, en un netbook con XP. En Windows 7 me sale un error esotérico durante el proceso de instalación, el cual me impidió seguir adelante.  Aunque como es un programón, primero hay que instalar bases de datos SQL y otras cosas que suenan y se ven complicadas.

Al final, pude probarlo y se ve bastante bonito, es rápido y además cuenta con muchas opciones administrativas para la traducción, como por ejemplo plazos de entrega y estados de avance para cada documento. Otra particularidad es que segmenta originalmente por párrafos, lo que facilita el trabajo a la hora de fusionar o dividir oraciones al traspasarlas a otra lengua. Permite importar memorias en formato TMX sin grandes contratiempos, aunque para mi gusto un poco lentamente (aunque puede ser culpa del hardware, hay que ser justos).

También tiene varias alternativas de traducción automática en línea (intertran, systran y otros), que se despliegan [desafortunadamente] en Explorer, aunque uno tenga otro navegador predeterminado.  Posee además una función poco frecuente en otras herramientas es que cuenta la cantidad de palabras por las que nuestra traducción excede al original, o viceversa, lo que es muy útil cuando hay restricciones de espacio.

De todas formas, aunque se ve bastante atractivo y poderoso, no sé si vale la pena tanta parafernalia. Tendría que poder instalarlo en mi maquinita regalona y poder probarlo con mayor comodidad que la que puede dar un netbook de teclas minúsculas.

Así que eso no más. Si alguien se anima, que pruebe cuando tenga algo de tiempo. Total es gratis (aunque exige registrarse, a menos que se use el demo),

Les dejo algunas capturas de pantalla para que se hagan una idea.

El pase de diapositivas requiere JavaScript.

Add to FacebookAdd to DiggAdd to Del.icio.usAdd to StumbleuponAdd to RedditAdd to BlinklistAdd to TwitterAdd to TechnoratiAdd to Yahoo BuzzAdd to Newsvine

Deja un comentario

Archivado bajo CAT, Opiniones, Reseñas, Traducción

Trados, Wordfast ¿y qué más?

Cuando pensamos en herramientas de traducción, lo más probable es que la mayoría de nosotros piense en Trados, Wordfast o, con suerte, DejaVu. (Aunque eso de mayoría es relativo, ya que probablemente muchos no tengan idea de lo que hablo).

Pero resulta que el panorama es mucho más amplio. Ahora bien, si bien yo tiendo a simpatizar más con Wordfast por un tema de actitud comercial y romanticismo (como decía en una entrada anterior, el creador de wordfast es el tatarasobrino del Champollion de la piedra de Rosetta), hay que dejar en claro que cada herramienta tiene sus pros y sus contras. Todo depende del tipo de proyecto que vayamos a traducir. Para traducir páginas web, por ejemplo, es posible que Trados sea más amigable que Wordfast Classic. Pero este último sale mucho más barato, así que si podemos tratar con los famosos “tags” del HTML, quizá no nos resulte necesario embarcarnos con Trados.

Pero me estoy yendo por las ramas. La idea de esta entrada era hablar de otros programas con los que me he cruzado últimamente, que tienen una gran ventaja nada despreciable: son GRATUITOS para traductores autónomos: Símilis y Across.

Desafortunadamente, aunque se ven lindos no he tenido buenos resultados con ninguno, pero eso no quiere decir que sean malos. Lo más probable es que se trate de un problema de compatibilidad, ya que para varias mis configuraciones son un tanto “especiales”.

1. Similis tiene la gracia de contar con diccionarios incorporados para algunos idiomas europeos, por lo que los traductores de inglés, francés y español tienen una ventaja. Esto permite el reconocimiento terminológico en tiempo real, lo que permite ganar tiempo para no tener que buscar las palabras a propósito. Se puede usar con otras lenguas, pero no se pueden aprovechar los diccionarios.

(click para agrandar)

Una gracia de Similis es que tiene la función de alineación de textos, que al basarse en los diccionarios incorporados, no funciona únicamente según la segmentación del original y la traducción, sino que también según parámetros lingüísticos.

Desafortunadamente mi prueba no resultó como esperaba, ya que no fue capaz de encontrar pares textuales en un texto de prueba inglés – castellano.

El otro problema que experimenté fue el proceso mismo de traducción: nunca pude pasar de la primera unidad de traducción, ya que el supuesto comando para tal efecto simplemente no funcionó. Puede ser que se deba a que mi sistema es win 7 -64 bits.

(click para agrandar)

Como no domino tanto detalle y la documentación del programa está en francés, tendrá que quedarse ahí por el momento.

Otro día veremos que pasó con Across y alguna que otra herramienta, ya que la oferta crece cada vez más.

Add to FacebookAdd to DiggAdd to Del.icio.usAdd to StumbleuponAdd to RedditAdd to BlinklistAdd to TwitterAdd to TechnoratiAdd to Yahoo BuzzAdd to Newsvine

3 comentarios

Archivado bajo CAT, Opiniones

Wide2Narrow, o de gordos a flaquitos

Hoy en día, casi todas las herramientas de traducción reconocen de manera automática números y símbolos que, por lo general, deben mantenerse en la traducción, ahorrándonos la necesidad de tipearlos y evitándonos el riesgo de equivocarnos al hacerlo. Desafortunadamente, si traducimos desde el japonés, nos encontraremos con números u otros caracteres “más rellenitos” que no serán identificados como tales. Si bien en términos de significado 4 ? )y @ son lo mismo que 4 ? ) y @, en términos técnicos son diferentes. Los primeros pertenecen al juego de caracteres japoneses (double byte) y por lo tanto, no son visibles en un computador que no tenga habilitada la visualización de caracteres asiáticos. Además, en mi experiencia, estos caracteres tienen un mayor peso relativo en los segmentos de una memoria de traducción, lo que hace que disminuya el porcentaje de posibles coincidencias.

Para que se entienda:

Si tenemos un número de teléfono, y lo debemos traducir, tendríamos que copiar los dígitos uno a uno, ya que no serán reconocidos

Números anchos en formato japones

Números anchos en formato japonés

Entonces, lo más recomendable es reemplazar todos estos caracteres antes de traducir, para que nuestra herramienta preferida los pueda reconocer, o para que al cliente no le aparezcan mamarrachos donde hay que ver números. Este reemplazo puede hacerse fácilmente con una macro de Word, desarrollada por GITS, que pueden encontrar aquí, junto con las instrucciones correspondientes. (innecesarias para mis alumnos…espero)

Así, una vez aplicada la macro, wordfast o cualquier otra herramienta reconocerá los números como tales, ahorrándonos la necesidad de copiarlos a mano:

Números occidentalizados

Tras aplicar la macro, los números se convierten al formato latino.

El encuadre rojo significa que wordfast lo reconoce como una unidad que puede copiarse automáticamente en el texto meta. Fácil y bonito.

2 comentarios

Archivado bajo CAT