Archivo de la etiqueta: CAT tools

Pequeña nota de actualización sobre glosarios de la IATE

Hace un tiempo les conté sobre la posibilidad de comprar por una módica suma los glosarios de la IATE. Nadie dijo ni pío así que me imagino que no resultó tan emocionante como me habría imaginado. De todas formas, a petición del dueño del sitio, hoy les hago una pequeña actualización al respecto, que debería ser de especial  interés para quienes usen Wordfast:

  1.  Ahora se ofrece un formato nativo para Wordfast, tanto para glosarios como para memorias, que puede usarse tanto en Classic como Pro.
  2. La extracción sigue una agrupación predeterminada de los términos según los 5 grupos temáticos de la IATE. Esto permite manejar mejor los glosarios por tema en lugar de tener un monstruo con muchocientos mil (o tropecientos mil) términos.
  3. Se puede pedir una extracción personalizada de temas seleccionados por el usuario.
  4. Se usa la versión más reciente de los glosarios (enero de 2015)

Más detallas en santrans.net

Para mi gusto, siempre es bueno tener glosarios activos, sobre todo si son de buenas fuentes. A veces no solo ahorras tiempo en buscar, sino que hasta en tipear.

Eso no más, pues.

 

Anuncios

Deja un comentario

Archivado bajo Traducción

Traducción automática de fechas japonesas en memoQ

Aunque lejos están los días de las actualizaciones semanales, trataré de no tenerlos tan abandonados este “fresquito” verano.

Así que les contaré hoy algo que hace rato me andaba rondando: la traducción automática de fechas  niponas en el programita que destronó a Wordfast en mi corazón: memoQ. (No desesperen, no quiere decir que ya no sea hincha de wordfast, solo que ahora uso más memoQ).

Entonces, pasa que muchas veces las fechas japonesas vienen en el formato

昭和60年9月13日 (Era oficial, año, mes y día)

lo que por lo general no nos sirve en castellano, donde necesitamos día, mes y año gregoriano: (13 de septiembre de 1985)

Aunque con el día y el mes no hay mucho problema, la equivalencia entre eras oficiales y años gregorianos puede ser un lío. Normalmente yo tengo una listita pegada en la pared, pero igual es un poco incómodo. Y si memoQ y nuestra inventiva puede venir al rescate, bienvenido sea.

¿Entonces, cómo se hace?

Primero hay que confeccionar una regla de autotraducción en el panel de configuración (Ventana del proyecto o consola de recursos, luego “settings” y “autotranslation rules)

Si queremos entender la mecánica de las reglas de autotraducción, primero tenemos que dominar más o menos la búsqueda con comodines en Word. Aunque a primera vista nos puede parecer algo marciano, aburrido y de poca utilidad, es una herramienta tan potente que puede ahorrar mucho tiempo al traductor avispado. Lo recomiendo a ojos cerrados, aunque requiere invertir un poco de tiempo dominar y diseñar las búsquedas, el tiempo que se ahorra justifica la inversión.

Ahora bien, el que no tenga tiempo y quiera solo aprovecharlo, puede copiar los pasos siguientes:

Primero, ir a la pestaña de “translation pairs” y copiar lo que sigue. Aquí es donde le decimos a memoQ qué debe reemplazar con qué.  Ojo que esta es la parte tediosa porque hay que hacer listas separadas para los días, meses y años (yo hice desde la era Taisho en adelante, pues antes no es muy frecuente en mis traducciones).

Paso 1

Paso 1

La mismo en las eras:

Paso 2

Paso 2

Luego hay que decirle a memoQ el orden que necesitamos para el reemplazo, o sea crear la regla. En este caso la lista de los años equivale a $1, la de los meses a $2 y la de los días a $3. Entonces, como queremos que el orden salga al revés y con un la preposición “de” entremedio, le instruimos al programa que los reemplace en el orden que deseamos y ponga de entre cada elemento.

Paso 3

Paso 3

Así, 昭和52年1月14日 nos quedará automáticamente como 14 de enero de 1977 y nos saldrá marcado en verde en el panel de resultados de memoq.

Emocionante, ¿no?

Ahora bien, si están mucho más ocupados y no tienen tiempo para configurarlo, pueden bajar el archivo que yo creé con la regla desde el Language Terminal de Kilgray. Tienen que tener una cuenta en Language terminal eso sí. Busquen “fechas japonesas” en la sección de búsqueda de recursos. Suerte, y si encuentran alguna pifia, sean buenitos y avisen.

Un detalle que se me olvidaba: los números debe estar en el mismo formato que los ingresados en la regla: si ponen 15 en ella y el original que traducen dice 15, no funcionará, a menos que hagan otra regla con ese formato numérico.

Deja un comentario

Archivado bajo CAT, Traducción

Una herramienta muy útil: Transtools

Hoy toca contarles acerca de Transtools, desarrollado por Stanislav Okhvat. Es una aplicación sumamente útil que nos permite hacer en de un suácate labores que normalmente nos tomarían bastante más tiempo, o no sabríamos hacer o tendríamos que rebuscar entre los botones y menús de Word, Excel y Visio.  Como seguro que lo primero que se preguntarán es el precio, empiezo por decirles que es gratis, aunque para acceder a algunas funciones (re pocas, la verdad) hay que pagar la módica suma de 20 dólares. La idea es probarla todo lo que se puede y decidir si vale la pena la inversión o no. De momento yo no la he hecho, pero es probable que lo haga en futuro cercano.

Pero bueno, ¿qué se puede hacer con Transtools?

  •  Aplicar diversos formatos y estilos de una patada: por ejemplo, a veces nos vemos en la necesidad de aplicar el famoso tw4WinExternal para dejar texto afuera de la segmentación de nuestra CAT favorita. Igual con el texto oculto, que se puede hacer y deshacer.
  • Arreglar un documento mal formateado, como los que generados por programas de OCR o creados por personas de pocas luces (aquí mejor no entro en detalles).
  • Reemplazar distintas cadenas de texto de un solo guaracazo, sin tener que ir una por una cada vez.
  • Buscar texto destacado, incluso por color.
  • Y varias cosas más pero no las he probado o me da flojera explicar.
Transtools en Word

Barra de herramientas de Transtools en Word

Y eso es solo un ejemplo de lo que se puede hacer en Word. En Excel y Visio aún no he investigado mucho, pero se los dejo para que les pique la curiosidad. También hay una “utilities” que sirve para configurar algunos atajos de teclado en el sistema operativo. Échenle un vistacito, no se arrepentirán.

2 comentarios

Archivado bajo CAT, Localización, Reseñas, Traducción

Los glosarios de la IATE

Para que no parezca que este blog ahora es puro autobombo (ya saldrá una nueva entrada de esas), les cuento acerca de algo que puede interesar a más traductores que los que pasan por aquí normalmente. Eso, porque no tiene nada que ver con japonés. Me refiero a los glosarios de la IATE, que es la base de datos terminológicos de la UE. O sea, que tiene una chorrera de idiomas y combinaciones posibles.

Aunque hace rato que el sitio se puede consultar aquí, desde hace un tiempo es posible bajar la base de datos completita. Eso puede hacerse desde acá.  (en formato TBX)

¡Guau! Dirán algunos que como yo, bajen el archivo todo emocionados. Pero no todo es miel sobre hojuelas, ya que el tremendo archivo presenta una gran complicación:

Es un archivo gigante que tiene todas las lenguas de la UE. Eso quiere decir que a menos que traduzcamos desde o hacia los creo que 27 idiomas que la componen, tenemos bastante información que no nos sirve.

Por eso, mis intentos de importarla a Wordfast y a MemoQ fueron en vano: esperas eternas, computador pegado y cero resultados. O sea, no pude crear glosario utilizable alguno. Ya me estaba dando por vencido cuando buscando por ahí y por allá me encontré con la página de Henk, en Holanda:

santrans.net

quien por una módica suma (10 EUR el primer par de lenguas y 7,5 EUR pares adicionales) ofrece los archivos “podados” según tus necesidades: O sea, en vez de los millones de entradas multilingües, puede conseguirte sólo los pares lingüísticos que necesites, en mi caso, inglés a español, en un formato importable para tu TAC o CAT favorita.

El proceso de importación a MemoQ resultó de lo más sencillo y sin contratiempos. A Wordfast Pro ha dado algo más de trabajo, pero no creo que sea tanto más complicado. Si no me resulta, les cuento. Si me resulta, no les cuento nada.

Eso pues.

 

ACTUALIZACIÓN:

Ya, les cuento que pasó con Wordfast. La importación a Wf Classic acabo de hacerla hace algunos minutos y me tardé idem. Un par de minutillos y el bueno de Classic fue capaz de importar 593.484 términos en casi un paraguazo. Por otro lado, con Wf Pro la cosa fue un poco más complicada. Luego de dos horas tratando de importar de importar el archivo, que aunque podado es bien grandecito, me di por vencido. Ahí llegó nuevamente Henk al rescate con una versión del archivo en varios pedacitos de 10.000 entradas para una importación menos lenteja. Cada importación es más rápida, pero hay que repetir el proceso unas 50 veces para poder importarlo todo. Así que eso pues, la conclusión es que el glosario se puede importar también a los Wordfast, pero con algunos sobresaltos…todavía no me doy el tiempo para terminarlo en Pro.  Pro 0, Classic 1.

 

 

1 comentario

Archivado bajo Localización, Traducción

Los famosos descuentos por repetición

No sé si sea sólo una realidad fortuita o parte de un esfuerzo concertado de la industria por aprovecharse de los pobres traductores, pero la realidad es que si bien en teoría el uso herramientas TAC y sus memorias de traducción (MT) pueden ser un gran aliado del traductor, muchas veces terminan siendo un enemigo que lo obliga a trabajar por menos dinero del que le corresponde.

La mecánica es simple: la agencia entrega al traductor los textos que debe traducir y una MT que debe utilizar. La traducción realizada se analiza en comparación con las porciones de texto que ya están presentes en la memoria y según el resultado, se paga al traductor la tarifa completa por unidades nuevas, una tarifa reducida por unidades con determinado porcentaje de analogía y, a veces,  nada o una cantidad ínfima por las unidades completamente repetidas.

La lógica del mecanismo es impecable, pero ahí está la falla. El lenguaje y la traducción no siempre responden a la lógica. La premisa que sigue el razonamiento de las agencias es que una misma unidad no debería tener más de una traducción, por lo que las traducciones anteriores de determinados pasajes deberían poder reciclarse en caso de surja un texto igual. Pero este razonamiento no calza con la realidad. La traducción depende del contexto situacional del enunciado y del propósito de la traducción. Un ejemplo sencillo es el siguiente: 男 puede traducirse como “hombre, varón o macho”, según sea el caso, o como “masculino”, por ejemplo en la categoría “sexo”, de la sección “Datos personales” de una encuesta. Por lo tanto, aunque la máquina nos diga que hay un 100% de analogía, como traductores debemos estar pendientes de esas sutilezas. Es por eso que considero injusta la tarificación que practican muchas agencias. Lo mismo pasa con analogías cercanas al 80% 0 90% como en el caso de

社会がつぶれた  La sociedad colapsó

y

会社がつぶれた    La empresa quebró

donde con los mismos caracteres se escriben oraciones diferentes, pero tendrían una similitud de 84% según Wordfast Classic. ¿Por qué deberíamos recibir un pago descontado a cuenta del nivel de analogía, cuando hay que hacer el trabajo completo?

Claro, hay muchas veces en que el uso de las memorias aumenta la productividad y nos permite producir más rápido, sobre todo cuando las repeticiones son eso, repeticiones. Pero saber cuándo lo son y cuándo no, exige del profesionalismo y del tiempo del traductor.  Y eso vale plata, señores.

Afortunadamente en el mundo de las traducciones del japonés al español he tenido pocas experiencias de este tipo (aunque ya empiezan algunos a preguntar o imponer sus condiciones). Pero para los colegas que trabajan más con inglés, es pan de cada día.  Sería conveniente buscar ejemplos similares en diferentes pares de lenguas, para combatir esta práctica abusiva de las agencias…cuando se puede, pues por lo general es una batalla perdida. Otra alternativa menos saludable sería “no mirar para nada” las de 100% si no se pagan, pero con eso, la calidad final de la traducción terminará pagando los platos rotos.

13 comentarios

Archivado bajo CAT, Traducción

Contar palabras (2a parte)

Y seguimos entonces con esto del conteo. La idea era contarles de aplicaciones de pago, como Anycount, que sirven para el conteo en formatos distintos a Word, se pueden usar en varios archivos de forma simultánea y entregan un informe bien bonito, ordenado y detallado que podemos incluir en nuestra cotización. No obstante, gracias al comentario de Pablo Beauvier me enteré de la existencia de un pequeño programilla gratuito, que hace precisamente lo mismo, con la gracia de que incluso distingue entre letras asiáticas y occidentales. Se trata nada más y nada menos que de Count Anything. Hasta donde he podido probar, funciona bastante bien con archivos de Word, Excel, PowerPoint , HTML y PDF, aunque admite otros formatos que no he probado aún. (Tarea para el que quiera hacerlo).

Resultados con Count Anything

Nótese que distinque tipos de caracteres y permite contar archivos de distinto formato al mismo tiempo

La única desventaja que le veo frente a Anycount, es que no se puede configurar lo que queremos que cuente o ignore. Por ejemplo, a veces nos piden traducir una presentación en PowerPoint, pero ignorar las notas del orador que incluyen algunas diapositivas.  Anycount nos da la opción de ignorar las notas. Count Anything, no. Pero a caballo regalado, no le mires la configuración.

Otra cosa con respecto a los archivos de PowerPoint:  Al hacer clic derecho en el archivo e ir a Propiedades > Estadísticas veremos una línea donde figura un número que corresponde a la cantidad de palabras.  A partir de mi experiencia, iba a decir que no conviene fiarse de ese número porque suele ser inferior a la realidad, pero aparentemente a partir de Office 2007 resulta más preciso. Al menos con las pocas pruebas que acabo de hacer. Así que pueden sacar sus propias conclusiones.

¿Y qué pasa con los archivos PDF?

Primero, tenemos que entender que los hay de varios tipos:

  1. Los bien hechos o hechos “como la gente” de manera digital, en la que el texto se puede seleccionar y por lo tanto, contar.
  2. Los “hechos con los pies”, que son en realidad una foto escaneada y por lo tanto, no se pueden contar las palabras de buenas a primeras. En realidad no es que estén mal hechos, sino que dependen de las limitaciones y la no disponibilidad del texto en formato digital.
  3. Los más o menos, que son el resultado del OCR de una imagen. O sea, son una foto, pero se pueden contar, aunque a veces con detalles y letras mal reconocidas.

Entonces, para el primer tipo, podemos usar la herramienta antes mencionada, o esta otra solución un poco más nerd que no requiere otros programas. Para ello, hay que pegar el siguiente código en la consola de JavaScript y ejecutarlo, (para ejecutarlo en Acrobat Reader se selecciona el código y se presiona control y enter al mismo tiempo… según me explican, yo lo probé con otro lector de PDF)

var cnt=0;

for (var p = 0; p < this.numPages; p++)

cnt += getPageNumWords(p);

console.println(“There are ” + cnt + ” words in this doc.”);

Para que les quede más claro, les dejo unas capturas de pantalla que me mandó la personita que me lo enseñó.

paso 1 paso 2 paso 3

Y creo que eso sería lo que iba a contarles. Hay otras herramientas (por ejemplo, Practicount & Invoice) pero no la conozco. Entiendo que presenta más funcionalidades y configurabilidad que podría resultar muy útil.

Ah, otra cosa: Anycount, viene incluido como función dentro del TO3000 del que les hablé en otra ocasión. Si lo compran  a través de este enlace, se supone que me toca comisión. No ha pasado nunca eso sí…o nadie me lee o nadie me cree. 🙂

Bonus track:

Me preguntaron por Facebook qué hacer en el caso de los hard copy,  pues nos vemos obligados  a contar a mano y perder mucho tiempo. Lamentablemente no es mucho lo que se puede hacer, pero lo que se me ocurre, sería:

1) Escanear a la mejor resolución posible.

2) Aplicar un buen OCR, por ejemplo AbbyFineReader. Si el presupuesto no alcanza para ello, probar con la herramienta que debe venir instalada con el escáner.

3) Al aplicar el OCR, centrarse solo en el texto, ya que eso es lo que estamos contando, por lo tanto, no habría que guardarlo ni como PDF escaneado ni como RTF, bastará solo con el texto sin formato.

4) Contar las palabras con Word o la herramienta de preferencia.

Como el éxito del procedimiento dependerá de la calidad del original, si el original es fax o una fotocopia de fotocopia y un texto todo reventado, saldrá más rápido y sano no contar las palabras. En ese caso, aplicar ojímetro y decirle al cliente que cobras N por x cantidad de palabras, y que calculas que saldrá y veces esa cantidad.  Sorry y gomen, Sole, pero eso es todo lo que se me ocurre.

 

 

 

 

12 comentarios

Archivado bajo CAT, Traducción

Capacitación en Wordfast Classic

Paciencia, ya vendrán más entradas relacionadas con el japonés y la traducción. Hoy aprovecho de contarles que el viernes 5 de octubré realizaré una capacitación en línea acerca de Wordfast Classic.  Supongo que ya se habrán dado cuenta de que es  una de mis herramientas CAT favoritas, tanto por su sencillez como por su filosofía comercial.  El cursillo está dentro del marco de las capacitaciones que ofrece Proz.com. Los detalles técnicos, administrativos y comerciales se pueden consultar en la página de la capacitación: Wordfast Classic, nivel inicial.  Ah, y será en castellano, porsiaca.

Deja un comentario

Archivado bajo CAT

Wordfast y las tablas

No es raro que  vayamos  felices traduciendo un documento con Wordfast y nos encontremos con una tabla:

A veces esto nos borra la sonrisa, ya que al segmentar dentro de la celda perdemos de vista el texto,  el que queda aparentemente fuera de los márgenenes de la celda, así:

Normalmente esto pasa con documentos creados a partir de archivos PDF, por lo general cuando han sido escaneados y pasados por programa de OCR.  Lo que pasa es que las tablas resultantes quedan con un alto de fila fijo, que nos impide ver el texto como querríamos. Pero no hay que asustarse, ya que hay una solución sencilla.

Simplemente, seleccionamos la tabla y con clic derecho en el mouse, nos vamos a “propiedades de tabla”. Aparecerá un cuadro como este, pero en el idioma en que tengas tu sistema operativo, obvio. Perdón por lo exótico, pero al final es lo mismo.

En ese cuadro de diálogo que le llaman (siempre lo he encontrado un nombre un poco raro…ya, se supone que a través del cuadro uno dialoga con la máquina), hay que marcar donde dice mínimo (o algo parecido, no sé que dice exactamente en español…si algún lector coopera, lo actualizamos) , et voilá, problema solucionado. Ahora podemos visualizar sin problemas el texto de la tabla en sus celdas correspondientes.

Naturalmente, una vez limpio el texto las celdas tendrán el alto correspondiente al texto que contienen. Ojalá que les sirva.

4 comentarios

Archivado bajo CAT, Traducción