Archivo de la categoría: CAT

Acerca de herramientas de traducción (CAT-Computer Aided Translation Tools)

Kanjis anticuados y transtools al rescate

Muestra de kanjis en desuso

Quizás a más de alguien le ha pasado que encuentra en Aozorabunko un libro antiguo que le interesa, pero al ponerse a leer se da cuenta de que está escrito con kanjis antiguos, también conocidos como los infames 旧字. O sea, que en lugar de 悪 dice 惡 o 悅 en vez de 悦. Si la cosa llegara hasta ahí, no costaría tanto, porque tan distintos no son. Lo malo es que también se dan casos como 圓 y 鹽 que seguramente se nos harán un pelín más complicados, porque claro, ya no es tan obvio que corresponden a 円 y 塩 respectivamente.

Entonces, cuando después de años de estudio ya pensábamos que teníamos más o menos dominada la lectura, el japonés nos sale con otra de las suyas. Sin embargo, no todo está perdido. Si no queremos pasar quizás cuánto tiempo aprendiendo las equivalencias, podemos hacer una pequeña trampita: reemplazar de un simple paraguazo todos los kanjis antiguos por su versión actual.

¿Pero cómo? No podemos usar la función de buscar y reemplazar en Word para cambiar uno por uno cada kanji y cada vez, porque nos costaría mucho trabajo.

Pero no todo está perdido, pequeños saltamontes. Para eso tenemos Transtools+, una herramienta que sirve precisamente para eso y mucho, muchísimo más. Hace tiempo les hablé de su hermana melliza Transtools, de la que tienen una descripción un poco más detallada aquí. De la segunda, ya me dignaré a comentarla en detalle más adelante. Aunque no son gratis, sí son muy asequibles y sirven tanto que se amortizan solas.

Pero volvamos a lo que nos ocupa.

Bastará con bajar este archivo formateado como lista de reemplazo para Transtools+ (Bajarlo, abrirlo y copiarlo todo. En Transtools, «Multiple Find and Replace > New List > Import from clipboard > Save» y voilà. Listo para usar y reemplazar todos los kanjis viejitos por su versión actual.

Si se fijan, el formato es muy sencillo: dos columnas con la estructura kanji [tab] kanjis [enter] y nada más.

La lista de kanjis en cuestión, ordenada de あ a わん, proviene de: ちょっと便利帳

Eso sería tutti y hasta la próxima.

Anuncio publicitario

Deja un comentario

Archivado bajo Blog, CAT, Lingüística, Recursos

Traducción automática de fechas japonesas en memoQ

Aunque lejos están los días de las actualizaciones semanales, trataré de no tenerlos tan abandonados este «fresquito» verano.

Así que les contaré hoy algo que hace rato me andaba rondando: la traducción automática de fechas  niponas en el programita que destronó a Wordfast en mi corazón: memoQ. (No desesperen, no quiere decir que ya no sea hincha de wordfast, solo que ahora uso más memoQ).

Entonces, pasa que muchas veces las fechas japonesas vienen en el formato

昭和60年9月13日 (Era oficial, año, mes y día)

lo que por lo general no nos sirve en castellano, donde necesitamos día, mes y año gregoriano: (13 de septiembre de 1985)

Aunque con el día y el mes no hay mucho problema, la equivalencia entre eras oficiales y años gregorianos puede ser un lío. Normalmente yo tengo una listita pegada en la pared, pero igual es un poco incómodo. Y si memoQ y nuestra inventiva puede venir al rescate, bienvenido sea.

¿Entonces, cómo se hace?

Primero hay que confeccionar una regla de autotraducción en el panel de configuración (Ventana del proyecto o consola de recursos, luego «settings» y «autotranslation rules)

Si queremos entender la mecánica de las reglas de autotraducción, primero tenemos que dominar más o menos la búsqueda con comodines en Word. Aunque a primera vista nos puede parecer algo marciano, aburrido y de poca utilidad, es una herramienta tan potente que puede ahorrar mucho tiempo al traductor avispado. Lo recomiendo a ojos cerrados, aunque requiere invertir un poco de tiempo dominar y diseñar las búsquedas, el tiempo que se ahorra justifica la inversión.

Ahora bien, el que no tenga tiempo y quiera solo aprovecharlo, puede copiar los pasos siguientes:

Primero, ir a la pestaña de «translation pairs» y copiar lo que sigue. Aquí es donde le decimos a memoQ qué debe reemplazar con qué.  Ojo que esta es la parte tediosa porque hay que hacer listas separadas para los días, meses y años (yo hice desde la era Taisho en adelante, pues antes no es muy frecuente en mis traducciones).

Paso 1

Paso 1

La mismo en las eras:

Paso 2

Paso 2

Luego hay que decirle a memoQ el orden que necesitamos para el reemplazo, o sea crear la regla. En este caso la lista de los años equivale a $1, la de los meses a $2 y la de los días a $3. Entonces, como queremos que el orden salga al revés y con un la preposición «de» entremedio, le instruimos al programa que los reemplace en el orden que deseamos y ponga de entre cada elemento.

Paso 3

Paso 3

Así, 昭和52年1月14日 nos quedará automáticamente como 14 de enero de 1977 y nos saldrá marcado en verde en el panel de resultados de memoq.

Emocionante, ¿no?

Ahora bien, si están mucho más ocupados y no tienen tiempo para configurarlo, pueden bajar el archivo que yo creé con la regla desde el Language Terminal de Kilgray. Tienen que tener una cuenta en Language terminal eso sí. Busquen «fechas japonesas» en la sección de búsqueda de recursos. Suerte, y si encuentran alguna pifia, sean buenitos y avisen.

Un detalle que se me olvidaba: los números debe estar en el mismo formato que los ingresados en la regla: si ponen 15 en ella y el original que traducen dice 15, no funcionará, a menos que hagan otra regla con ese formato numérico.

Deja un comentario

Archivado bajo CAT, Traducción

Una herramienta muy útil: Transtools

Hoy toca contarles acerca de Transtools, desarrollado por Stanislav Okhvat. Es una aplicación sumamente útil que nos permite hacer en de un suácate labores que normalmente nos tomarían bastante más tiempo, o no sabríamos hacer o tendríamos que rebuscar entre los botones y menús de Word, Excel y Visio.  Como seguro que lo primero que se preguntarán es el precio, empiezo por decirles que es gratis, aunque para acceder a algunas funciones (re pocas, la verdad) hay que pagar la módica suma de 20 dólares. La idea es probarla todo lo que se puede y decidir si vale la pena la inversión o no. De momento yo no la he hecho, pero es probable que lo haga en futuro cercano.

Pero bueno, ¿qué se puede hacer con Transtools?

  •  Aplicar diversos formatos y estilos de una patada: por ejemplo, a veces nos vemos en la necesidad de aplicar el famoso tw4WinExternal para dejar texto afuera de la segmentación de nuestra CAT favorita. Igual con el texto oculto, que se puede hacer y deshacer.
  • Arreglar un documento mal formateado, como los que generados por programas de OCR o creados por personas de pocas luces (aquí mejor no entro en detalles).
  • Reemplazar distintas cadenas de texto de un solo guaracazo, sin tener que ir una por una cada vez.
  • Buscar texto destacado, incluso por color.
  • Y varias cosas más pero no las he probado o me da flojera explicar.

Transtools en Word

Barra de herramientas de Transtools en Word

Y eso es solo un ejemplo de lo que se puede hacer en Word. En Excel y Visio aún no he investigado mucho, pero se los dejo para que les pique la curiosidad. También hay una «utilities» que sirve para configurar algunos atajos de teclado en el sistema operativo. Échenle un vistacito, no se arrepentirán.

3 comentarios

Archivado bajo CAT, Localización, Reseñas, Traducción

III Congreso Cotich y I seminario Chile-Japón

Solo una notita rápida para mantenerlos informados acerca de dos eventos relacionados con traducción que tendrán lugar dentro de poco uno y dentro de unos meses el otro.

Ambos me tendrán participando de alguna u otra forma, así que ya sabe mi club de fans dónde me puede encontrar (claro).

El primero es el III congreso del Cotich, el colegio de traductores e Intérpretes de Chile, donde haré un pequeño taller sobre Wordfast classic.

El segundo, el I Seminario Internacional Chile-Japón donde hablaré (espero) algo sobre la traducción del japonés (todavía no sé qué).

Ambos eventos se realizarán en la Universidad de Santiago de Chile.

Aquí la info:

III congreso del Cotich

http://cotich.wordpress.com/2013/11/04/iii-congreso-de-traduccion-e-interpretacion-del-colegio-de-traductores-e-interpretes-de-chile-a-g/

 

Primer Seminario Internacional Chile -Japón

Español
http://www.globalcompetences.org/english/seminario2014en/seminario2014sp/

Japonés
http://www.globalcompetences.org/english/seminario2014en/seminario2014jp/

Inglés
http://www.globalcompetences.org/english/seminario2014en/

 

Deja un comentario

Archivado bajo CAT, Traducción

Los famosos descuentos por repetición

No sé si sea sólo una realidad fortuita o parte de un esfuerzo concertado de la industria por aprovecharse de los pobres traductores, pero la realidad es que si bien en teoría el uso herramientas TAC y sus memorias de traducción (MT) pueden ser un gran aliado del traductor, muchas veces terminan siendo un enemigo que lo obliga a trabajar por menos dinero del que le corresponde.

La mecánica es simple: la agencia entrega al traductor los textos que debe traducir y una MT que debe utilizar. La traducción realizada se analiza en comparación con las porciones de texto que ya están presentes en la memoria y según el resultado, se paga al traductor la tarifa completa por unidades nuevas, una tarifa reducida por unidades con determinado porcentaje de analogía y, a veces,  nada o una cantidad ínfima por las unidades completamente repetidas.

La lógica del mecanismo es impecable, pero ahí está la falla. El lenguaje y la traducción no siempre responden a la lógica. La premisa que sigue el razonamiento de las agencias es que una misma unidad no debería tener más de una traducción, por lo que las traducciones anteriores de determinados pasajes deberían poder reciclarse en caso de surja un texto igual. Pero este razonamiento no calza con la realidad. La traducción depende del contexto situacional del enunciado y del propósito de la traducción. Un ejemplo sencillo es el siguiente: 男 puede traducirse como “hombre, varón o macho”, según sea el caso, o como “masculino”, por ejemplo en la categoría “sexo”, de la sección “Datos personales” de una encuesta. Por lo tanto, aunque la máquina nos diga que hay un 100% de analogía, como traductores debemos estar pendientes de esas sutilezas. Es por eso que considero injusta la tarificación que practican muchas agencias. Lo mismo pasa con analogías cercanas al 80% 0 90% como en el caso de

社会がつぶれた  La sociedad colapsó

y

会社がつぶれた    La empresa quebró

donde con los mismos caracteres se escriben oraciones diferentes, pero tendrían una similitud de 84% según Wordfast Classic. ¿Por qué deberíamos recibir un pago descontado a cuenta del nivel de analogía, cuando hay que hacer el trabajo completo?

Claro, hay muchas veces en que el uso de las memorias aumenta la productividad y nos permite producir más rápido, sobre todo cuando las repeticiones son eso, repeticiones. Pero saber cuándo lo son y cuándo no, exige del profesionalismo y del tiempo del traductor.  Y eso vale plata, señores.

Afortunadamente en el mundo de las traducciones del japonés al español he tenido pocas experiencias de este tipo (aunque ya empiezan algunos a preguntar o imponer sus condiciones). Pero para los colegas que trabajan más con inglés, es pan de cada día.  Sería conveniente buscar ejemplos similares en diferentes pares de lenguas, para combatir esta práctica abusiva de las agencias…cuando se puede, pues por lo general es una batalla perdida. Otra alternativa menos saludable sería “no mirar para nada” las de 100% si no se pagan, pero con eso, la calidad final de la traducción terminará pagando los platos rotos.

13 comentarios

Archivado bajo CAT, Traducción

Contar palabras (2a parte)

Y seguimos entonces con esto del conteo. La idea era contarles de aplicaciones de pago, como Anycount, que sirven para el conteo en formatos distintos a Word, se pueden usar en varios archivos de forma simultánea y entregan un informe bien bonito, ordenado y detallado que podemos incluir en nuestra cotización. No obstante, gracias al comentario de Pablo Beauvier me enteré de la existencia de un pequeño programilla gratuito, que hace precisamente lo mismo, con la gracia de que incluso distingue entre letras asiáticas y occidentales. Se trata nada más y nada menos que de Count Anything. Hasta donde he podido probar, funciona bastante bien con archivos de Word, Excel, PowerPoint , HTML y PDF, aunque admite otros formatos que no he probado aún. (Tarea para el que quiera hacerlo).

Resultados con Count Anything

Nótese que distinque tipos de caracteres y permite contar archivos de distinto formato al mismo tiempo

La única desventaja que le veo frente a Anycount, es que no se puede configurar lo que queremos que cuente o ignore. Por ejemplo, a veces nos piden traducir una presentación en PowerPoint, pero ignorar las notas del orador que incluyen algunas diapositivas.  Anycount nos da la opción de ignorar las notas. Count Anything, no. Pero a caballo regalado, no le mires la configuración.

Otra cosa con respecto a los archivos de PowerPoint:  Al hacer clic derecho en el archivo e ir a Propiedades > Estadísticas veremos una línea donde figura un número que corresponde a la cantidad de palabras.  A partir de mi experiencia, iba a decir que no conviene fiarse de ese número porque suele ser inferior a la realidad, pero aparentemente a partir de Office 2007 resulta más preciso. Al menos con las pocas pruebas que acabo de hacer. Así que pueden sacar sus propias conclusiones.

¿Y qué pasa con los archivos PDF?

Primero, tenemos que entender que los hay de varios tipos:

  1. Los bien hechos o hechos «como la gente» de manera digital, en la que el texto se puede seleccionar y por lo tanto, contar.
  2. Los «hechos con los pies», que son en realidad una foto escaneada y por lo tanto, no se pueden contar las palabras de buenas a primeras. En realidad no es que estén mal hechos, sino que dependen de las limitaciones y la no disponibilidad del texto en formato digital.
  3. Los más o menos, que son el resultado del OCR de una imagen. O sea, son una foto, pero se pueden contar, aunque a veces con detalles y letras mal reconocidas.

Entonces, para el primer tipo, podemos usar la herramienta antes mencionada, o esta otra solución un poco más nerd que no requiere otros programas. Para ello, hay que pegar el siguiente código en la consola de JavaScript y ejecutarlo, (para ejecutarlo en Acrobat Reader se selecciona el código y se presiona control y enter al mismo tiempo… según me explican, yo lo probé con otro lector de PDF)

var cnt=0;

for (var p = 0; p < this.numPages; p++)

cnt += getPageNumWords(p);

console.println(«There are » + cnt + » words in this doc.»);

Para que les quede más claro, les dejo unas capturas de pantalla que me mandó la personita que me lo enseñó.

paso 1 paso 2 paso 3

Y creo que eso sería lo que iba a contarles. Hay otras herramientas (por ejemplo, Practicount & Invoice) pero no la conozco. Entiendo que presenta más funcionalidades y configurabilidad que podría resultar muy útil.

Ah, otra cosa: Anycount, viene incluido como función dentro del TO3000 del que les hablé en otra ocasión. Si lo compran  a través de este enlace, se supone que me toca comisión. No ha pasado nunca eso sí…o nadie me lee o nadie me cree. 🙂

Bonus track:

Me preguntaron por Facebook qué hacer en el caso de los hard copy,  pues nos vemos obligados  a contar a mano y perder mucho tiempo. Lamentablemente no es mucho lo que se puede hacer, pero lo que se me ocurre, sería:

1) Escanear a la mejor resolución posible.

2) Aplicar un buen OCR, por ejemplo AbbyFineReader. Si el presupuesto no alcanza para ello, probar con la herramienta que debe venir instalada con el escáner.

3) Al aplicar el OCR, centrarse solo en el texto, ya que eso es lo que estamos contando, por lo tanto, no habría que guardarlo ni como PDF escaneado ni como RTF, bastará solo con el texto sin formato.

4) Contar las palabras con Word o la herramienta de preferencia.

Como el éxito del procedimiento dependerá de la calidad del original, si el original es fax o una fotocopia de fotocopia y un texto todo reventado, saldrá más rápido y sano no contar las palabras. En ese caso, aplicar ojímetro y decirle al cliente que cobras N por x cantidad de palabras, y que calculas que saldrá y veces esa cantidad.  Sorry y gomen, Sole, pero eso es todo lo que se me ocurre.

 

 

 

 

12 comentarios

Archivado bajo CAT, Traducción

Contar palabras (1a parte)

Ya, ¿me echaron mucho de menos?

Pasa que la semana pasada estuve muy ocupado (aparte de poco ocurrente), por lo que tuve que dejarlos sin post. Pero no desesperen que ya estoy de vuelta, creo. Esta vez con algo de utilidad pública no necesariamente para los raros del japonés.

Contar las palabras y caracteres de distintos tipos de archivo es fundamental para el traductor, puesto que serán la base de lo que va a cobrar y lo que va a tardar. Entonces, para que no nos quedemos cortos (ni largos), veamos algunas formas de contar palabras con mayor o menor precisión.  Ahora, si el cliente nos sale por teléfono con que «son solamente como 2 páginas», hay que sospechar. Casi seguro que serán muchos miles de palabras y si cotizamos «dos paginitas», estaremos fritos (por lo demás, tampoco es recomendable cotizar sin ver al menos una muestra del texto).

Entonces, ¿cómo contamos las palabras o caracteres?

1. Para documentos en Word:

Es lo más sencillo, porque basta con usar la función incorporada. Pero hay que tener ojo de todas formas:

Si la versión de Word es anterior a 2007, las notas al pie, los cuadros de texto y similares serán olímpicamente ignorados. Lo que puede ser fatal a la hora de cotizar. Afortunadamente, eso ya no pasa desde Word 2007 (¿quién dijo que era malo?). Pero hay que acordarse de marcar la casilla final para que los incluya.

conteo de palabras

Conteo de palabras en español y japonés en Word

Lo bueno es que al diferenciar entre caracteres asiáticos y occidentales, podemos hacer una cotización más exacta. Si un texto japonés, que cobraremos por caracter tiene muchas palabras en romaji, al contarlas por carácter podríamos estar estafando al cliente sin querer.  Por ejemplo, el documento de la foto tiene 30 «palabras», combinando caracteres japoneses y palabras españolas, pero 108 caracteres en total.

Si tenemos Word 2003, no le creemos a Microsoft o necesitamos una estadística más detallada, podemos usar la herramienta «Complete Wordcount» eso sí una vez que la actualicen, porque está en proceso de renovación.  (Gratis… al menos hasta hace un tiempo).

Otra opción puede ser +Tools, un complemento gratuito para Wordfast. Tiene la ventaja de que permite un conteo en varios archivos a la vez y genera un informe con la estadística total e individual de los archivos:

Ejemplo de conteo con +Tools

Ejemplo de conteo con +Tools

La desventaja es que no diferencia entre los tipos de caracteres japoneses y occidentales, pero bueno, eso nos importa solo a unos pocos. Y si estamos en serio, podemos usar la función de estadísticas de MemoQ, que sí la hace, y aparte, nos muestra la cantidad de segmentos, porcentaje de coincidencias con nuestras memorias, etc. todo lo cual nos servirá a la hora de ponderar la carga de trabajo necesaria.

Estadísticas en MemoQ

Estadísticas en MemoQ

Ahora bien, si usamos todos los métodos antes mencionados en un mismo documento, veremos que suele haber disparidad en los resultados, con MemoQ siendo por lo general el más generoso en los conteos (los ejemplos de las fotos son aleatorios, no es tanta la diferencia, no se me asusten). Eso se debe a que los criterios para considerar qué es una palabra difieren según la herramienta. Para algunas, John’s puede ser sólo 1 palabra y para otros, dos. Por lo tanto, lo importante es ponerse de acuerdo con el cliente en el conteo.

Otro día vemos qué hacer para otros formatos.

3 comentarios

Archivado bajo CAT, Traducción, Uncategorized

Capacitación en Wordfast Classic

Paciencia, ya vendrán más entradas relacionadas con el japonés y la traducción. Hoy aprovecho de contarles que el viernes 5 de octubré realizaré una capacitación en línea acerca de Wordfast Classic.  Supongo que ya se habrán dado cuenta de que es  una de mis herramientas CAT favoritas, tanto por su sencillez como por su filosofía comercial.  El cursillo está dentro del marco de las capacitaciones que ofrece Proz.com. Los detalles técnicos, administrativos y comerciales se pueden consultar en la página de la capacitación: Wordfast Classic, nivel inicial.  Ah, y será en castellano, porsiaca.

Deja un comentario

Archivado bajo CAT

Wordfast y las tablas

No es raro que  vayamos  felices traduciendo un documento con Wordfast y nos encontremos con una tabla:

A veces esto nos borra la sonrisa, ya que al segmentar dentro de la celda perdemos de vista el texto,  el que queda aparentemente fuera de los márgenenes de la celda, así:

Normalmente esto pasa con documentos creados a partir de archivos PDF, por lo general cuando han sido escaneados y pasados por programa de OCR.  Lo que pasa es que las tablas resultantes quedan con un alto de fila fijo, que nos impide ver el texto como querríamos. Pero no hay que asustarse, ya que hay una solución sencilla.

Simplemente, seleccionamos la tabla y con clic derecho en el mouse, nos vamos a «propiedades de tabla». Aparecerá un cuadro como este, pero en el idioma en que tengas tu sistema operativo, obvio. Perdón por lo exótico, pero al final es lo mismo.

En ese cuadro de diálogo que le llaman (siempre lo he encontrado un nombre un poco raro…ya, se supone que a través del cuadro uno dialoga con la máquina), hay que marcar donde dice mínimo (o algo parecido, no sé que dice exactamente en español…si algún lector coopera, lo actualizamos) , et voilá, problema solucionado. Ahora podemos visualizar sin problemas el texto de la tabla en sus celdas correspondientes.

Naturalmente, una vez limpio el texto las celdas tendrán el alto correspondiente al texto que contienen. Ojalá que les sirva.

4 comentarios

Archivado bajo CAT, Traducción

TO3000

Normalmente cuando se habla del uso de la computación en el trabajo del traductor, se hace referencia a las herramientas de traducción asistida (CAT tools), a gestores terminológicos, reconocedores de voz o cualquier otro tipo de programa relacionado con aspectos lingüísticos. Sin embargo, existe una variedad de aplicaciones que no son tan famosas como las anteriores pero que pueden resultar tanto o más útiles: las programas administrativos.

Apenas empezamos a trabajar, empezamos a darnos cuenta de que hay que organizarse de algún modo:

  1. ¿Cúando debo entregar el trabajo?
  2. ¿Cuánto tengo que cobrar?
  3. ¿Qué trabajos he hecho ya para este cliente?
  4. ¿A este cliente le cobro de inmediato o a fin de mes?
  5. ¿Cuánto saldría el documento que me piden que cotice?

Al principio hacemos todo eso a mano, quizás en una agenda o con más suerte en un archivo excel escondido en algún recoveco de nuestra máquina. Con el tiempo nos damos cuenta de no nos está resultando tan bien como pensábamos, que se nos olvida cobrar, que no sabemos cuánto facturamos el mes anterior, que crear una a una nuestras facturas no es nada eficiente, etc. O sea, en el ámbito administrativo, no somos tan productivos como desearíamos, lo que nos quita tiempo para lo que realmente nos apasiona: traducir (y vivir de eso).

Ahí es donde aparecen los programas que les mencionaba recién. Para todas esas labores administrativas y tediosas, está TO3000 , de AIT software, Ucrania, creado por y para traductores. Precisamente por eso, se adapta fácilmente a nuestras necesidades. Yo lo uso desde la versión 8 y acabo de cambiarme a la versión 10.

Entre sus muchas gracias, está la creación de cotizaciones y facturas de estilo profesional con solo unos cuantos pasos. Además, incluye un software para contar palabras en distintos formatos (muy configurable), lo que ayuda una enormidad a la hora de sacar cuentas. También nos permite calcular en cosa de segundos lo que hemos ganado, lo que nos deben, lo que hemos gastado, etc. Si bien es un programa de pago, es una excelente inversión que se recuperará al poco tiempo, gracias al tiempo que nos permite ahorrar.

Aunque esta entrada suene a propaganda, soy un fiel y agradecido fan de este programa y lo recomiendo sin remordimientos. Además, el servicio técnico de post venta llega a ser emocionante: siempre responden a tiempo para solucionar cualquier inconveniente. No los entretengo más y los invito a bajar el demo…aquí.

 

4 comentarios

Archivado bajo CAT, Reseñas, Traducción