Archivo mensual: marzo 2013

Taketombo books, Satori ediciones y Quaterni

Recuerdo que cuando empecé a estudiar japonés a mediados de los años 90, tanto para mí como para mi entorno era todo un mundo desconocido, ultra exótico y distante.  En aquel entonces Internet estaba en pañales y conseguir información sobre la lengua y la cultura podía resultar una odisea. La información de los libros solía estar un tanto desactualizada, plagada de estereotipos o ser un refrito de enciclopedia.  Además, la gran mayoría de las pocas traducciones de literatura nipona presentes en las librerías, eran traducciones indirectas del inglés o francés. Casi veinte años después, (¡oh cómo pasa el tiempo!), poco a poco las cosas han ido cambiando. Más traductores, más estudiantes y más estudiosos abordan los temas japoneses. Por otro lado, el mundo japonés ha comenzado a resultar poco a poco más atractivo para las editoriales, incluso dando paso a la aparición de algunas dedicadas exclusivamente al país del sushi (ya les dije que en los 90 había mucho estereotipo).

Un ejemplo de estas editoriales es Taketombo books, un emprendimiento reciente de María, mi sempai en la Universidad de Tokio hace ya unos añotes. Aparte del nombre, (“libélula de bambú”, que corresponde a esa hélice de juguete que hacíamos volar frotando las manos), una de las gracias de Taketombo es que más que publicar obras japonesas, se centra en la transculturalidad entre España y Japón, a través de autores de ambos países. Un ejemplo de ello es su primer libro editado, Tadaima (típica expresión que se dice al llegar a casa “ya llegué” o “ya vine”, como creo que dicen en México), en el que se reúnen las experiencias transculturales entre España y Japón de 6 autores  jóvenes. De lectura rápida y amena, y precio más que asequible (3.95 EUR, 2 lucas y media en pesos chilenos), me pareció bastante interesante y recomendable para todo interesado en la cultura de nuestros “vecinos” al otro lado del Pacífico. Ahora, leído como uno más que tuvo experiencias similares a las relatadas, uno puede percatarse además de las diferencias de percepción dentro del mundo hispano, o sea, cosas japonesas que chocan a los españoles pero a los latinoamericanos no tanto, por ejemplo. Pero bueno, mejor que lo lean y cada uno saque sus propias conclusiones.

Otras casas editoras del mundillo japo que recientemente he descubierto pero no he tenido aún la oportunidad de explorar mucho son Satori Ediciones, con un tinte más clásico y académico; y Quaterni, aparentemente más dedicada al género chanbara o de capa y espada, o sea, ninjas y samuráis.

Así que muy bien por todos estas empresas que aportan con su granito para el puente cultural entre Niponia y el mundo hispano. A ver cuándo vemos algo parecido en este hemisferio.

 

2 comentarios

Archivado bajo Cultura japonesa, Reseñas

Contar palabras (2a parte)

Y seguimos entonces con esto del conteo. La idea era contarles de aplicaciones de pago, como Anycount, que sirven para el conteo en formatos distintos a Word, se pueden usar en varios archivos de forma simultánea y entregan un informe bien bonito, ordenado y detallado que podemos incluir en nuestra cotización. No obstante, gracias al comentario de Pablo Beauvier me enteré de la existencia de un pequeño programilla gratuito, que hace precisamente lo mismo, con la gracia de que incluso distingue entre letras asiáticas y occidentales. Se trata nada más y nada menos que de Count Anything. Hasta donde he podido probar, funciona bastante bien con archivos de Word, Excel, PowerPoint , HTML y PDF, aunque admite otros formatos que no he probado aún. (Tarea para el que quiera hacerlo).

Resultados con Count Anything

Nótese que distinque tipos de caracteres y permite contar archivos de distinto formato al mismo tiempo

La única desventaja que le veo frente a Anycount, es que no se puede configurar lo que queremos que cuente o ignore. Por ejemplo, a veces nos piden traducir una presentación en PowerPoint, pero ignorar las notas del orador que incluyen algunas diapositivas.  Anycount nos da la opción de ignorar las notas. Count Anything, no. Pero a caballo regalado, no le mires la configuración.

Otra cosa con respecto a los archivos de PowerPoint:  Al hacer clic derecho en el archivo e ir a Propiedades > Estadísticas veremos una línea donde figura un número que corresponde a la cantidad de palabras.  A partir de mi experiencia, iba a decir que no conviene fiarse de ese número porque suele ser inferior a la realidad, pero aparentemente a partir de Office 2007 resulta más preciso. Al menos con las pocas pruebas que acabo de hacer. Así que pueden sacar sus propias conclusiones.

¿Y qué pasa con los archivos PDF?

Primero, tenemos que entender que los hay de varios tipos:

  1. Los bien hechos o hechos “como la gente” de manera digital, en la que el texto se puede seleccionar y por lo tanto, contar.
  2. Los “hechos con los pies”, que son en realidad una foto escaneada y por lo tanto, no se pueden contar las palabras de buenas a primeras. En realidad no es que estén mal hechos, sino que dependen de las limitaciones y la no disponibilidad del texto en formato digital.
  3. Los más o menos, que son el resultado del OCR de una imagen. O sea, son una foto, pero se pueden contar, aunque a veces con detalles y letras mal reconocidas.

Entonces, para el primer tipo, podemos usar la herramienta antes mencionada, o esta otra solución un poco más nerd que no requiere otros programas. Para ello, hay que pegar el siguiente código en la consola de JavaScript y ejecutarlo, (para ejecutarlo en Acrobat Reader se selecciona el código y se presiona control y enter al mismo tiempo… según me explican, yo lo probé con otro lector de PDF)

var cnt=0;

for (var p = 0; p < this.numPages; p++)

cnt += getPageNumWords(p);

console.println(“There are ” + cnt + ” words in this doc.”);

Para que les quede más claro, les dejo unas capturas de pantalla que me mandó la personita que me lo enseñó.

paso 1 paso 2 paso 3

Y creo que eso sería lo que iba a contarles. Hay otras herramientas (por ejemplo, Practicount & Invoice) pero no la conozco. Entiendo que presenta más funcionalidades y configurabilidad que podría resultar muy útil.

Ah, otra cosa: Anycount, viene incluido como función dentro del TO3000 del que les hablé en otra ocasión. Si lo compran  a través de este enlace, se supone que me toca comisión. No ha pasado nunca eso sí…o nadie me lee o nadie me cree. 🙂

Bonus track:

Me preguntaron por Facebook qué hacer en el caso de los hard copy,  pues nos vemos obligados  a contar a mano y perder mucho tiempo. Lamentablemente no es mucho lo que se puede hacer, pero lo que se me ocurre, sería:

1) Escanear a la mejor resolución posible.

2) Aplicar un buen OCR, por ejemplo AbbyFineReader. Si el presupuesto no alcanza para ello, probar con la herramienta que debe venir instalada con el escáner.

3) Al aplicar el OCR, centrarse solo en el texto, ya que eso es lo que estamos contando, por lo tanto, no habría que guardarlo ni como PDF escaneado ni como RTF, bastará solo con el texto sin formato.

4) Contar las palabras con Word o la herramienta de preferencia.

Como el éxito del procedimiento dependerá de la calidad del original, si el original es fax o una fotocopia de fotocopia y un texto todo reventado, saldrá más rápido y sano no contar las palabras. En ese caso, aplicar ojímetro y decirle al cliente que cobras N por x cantidad de palabras, y que calculas que saldrá y veces esa cantidad.  Sorry y gomen, Sole, pero eso es todo lo que se me ocurre.

 

 

 

 

12 comentarios

Archivado bajo CAT, Traducción

Contar palabras (1a parte)

Ya, ¿me echaron mucho de menos?

Pasa que la semana pasada estuve muy ocupado (aparte de poco ocurrente), por lo que tuve que dejarlos sin post. Pero no desesperen que ya estoy de vuelta, creo. Esta vez con algo de utilidad pública no necesariamente para los raros del japonés.

Contar las palabras y caracteres de distintos tipos de archivo es fundamental para el traductor, puesto que serán la base de lo que va a cobrar y lo que va a tardar. Entonces, para que no nos quedemos cortos (ni largos), veamos algunas formas de contar palabras con mayor o menor precisión.  Ahora, si el cliente nos sale por teléfono con que «son solamente como 2 páginas», hay que sospechar. Casi seguro que serán muchos miles de palabras y si cotizamos «dos paginitas», estaremos fritos (por lo demás, tampoco es recomendable cotizar sin ver al menos una muestra del texto).

Entonces, ¿cómo contamos las palabras o caracteres?

1. Para documentos en Word:

Es lo más sencillo, porque basta con usar la función incorporada. Pero hay que tener ojo de todas formas:

Si la versión de Word es anterior a 2007, las notas al pie, los cuadros de texto y similares serán olímpicamente ignorados. Lo que puede ser fatal a la hora de cotizar. Afortunadamente, eso ya no pasa desde Word 2007 (¿quién dijo que era malo?). Pero hay que acordarse de marcar la casilla final para que los incluya.

conteo de palabras

Conteo de palabras en español y japonés en Word

Lo bueno es que al diferenciar entre caracteres asiáticos y occidentales, podemos hacer una cotización más exacta. Si un texto japonés, que cobraremos por caracter tiene muchas palabras en romaji, al contarlas por carácter podríamos estar estafando al cliente sin querer.  Por ejemplo, el documento de la foto tiene 30 “palabras”, combinando caracteres japoneses y palabras españolas, pero 108 caracteres en total.

Si tenemos Word 2003, no le creemos a Microsoft o necesitamos una estadística más detallada, podemos usar la herramienta “Complete Wordcount” eso sí una vez que la actualicen, porque está en proceso de renovación.  (Gratis… al menos hasta hace un tiempo).

Otra opción puede ser +Tools, un complemento gratuito para Wordfast. Tiene la ventaja de que permite un conteo en varios archivos a la vez y genera un informe con la estadística total e individual de los archivos:

Ejemplo de conteo con +Tools

Ejemplo de conteo con +Tools

La desventaja es que no diferencia entre los tipos de caracteres japoneses y occidentales, pero bueno, eso nos importa solo a unos pocos. Y si estamos en serio, podemos usar la función de estadísticas de MemoQ, que sí la hace, y aparte, nos muestra la cantidad de segmentos, porcentaje de coincidencias con nuestras memorias, etc. todo lo cual nos servirá a la hora de ponderar la carga de trabajo necesaria.

Estadísticas en MemoQ

Estadísticas en MemoQ

Ahora bien, si usamos todos los métodos antes mencionados en un mismo documento, veremos que suele haber disparidad en los resultados, con MemoQ siendo por lo general el más generoso en los conteos (los ejemplos de las fotos son aleatorios, no es tanta la diferencia, no se me asusten). Eso se debe a que los criterios para considerar qué es una palabra difieren según la herramienta. Para algunas, John’s puede ser sólo 1 palabra y para otros, dos. Por lo tanto, lo importante es ponerse de acuerdo con el cliente en el conteo.

Otro día vemos qué hacer para otros formatos.

3 comentarios

Archivado bajo CAT, Traducción, Uncategorized