Archivo de la etiqueta: datos

Contar palabras (2a parte)

Y seguimos entonces con esto del conteo. La idea era contarles de aplicaciones de pago, como Anycount, que sirven para el conteo en formatos distintos a Word, se pueden usar en varios archivos de forma simultánea y entregan un informe bien bonito, ordenado y detallado que podemos incluir en nuestra cotización. No obstante, gracias al comentario de Pablo Beauvier me enteré de la existencia de un pequeño programilla gratuito, que hace precisamente lo mismo, con la gracia de que incluso distingue entre letras asiáticas y occidentales. Se trata nada más y nada menos que de Count Anything. Hasta donde he podido probar, funciona bastante bien con archivos de Word, Excel, PowerPoint , HTML y PDF, aunque admite otros formatos que no he probado aún. (Tarea para el que quiera hacerlo).

Resultados con Count Anything

Nótese que distinque tipos de caracteres y permite contar archivos de distinto formato al mismo tiempo

La única desventaja que le veo frente a Anycount, es que no se puede configurar lo que queremos que cuente o ignore. Por ejemplo, a veces nos piden traducir una presentación en PowerPoint, pero ignorar las notas del orador que incluyen algunas diapositivas.  Anycount nos da la opción de ignorar las notas. Count Anything, no. Pero a caballo regalado, no le mires la configuración.

Otra cosa con respecto a los archivos de PowerPoint:  Al hacer clic derecho en el archivo e ir a Propiedades > Estadísticas veremos una línea donde figura un número que corresponde a la cantidad de palabras.  A partir de mi experiencia, iba a decir que no conviene fiarse de ese número porque suele ser inferior a la realidad, pero aparentemente a partir de Office 2007 resulta más preciso. Al menos con las pocas pruebas que acabo de hacer. Así que pueden sacar sus propias conclusiones.

¿Y qué pasa con los archivos PDF?

Primero, tenemos que entender que los hay de varios tipos:

  1. Los bien hechos o hechos «como la gente» de manera digital, en la que el texto se puede seleccionar y por lo tanto, contar.
  2. Los «hechos con los pies», que son en realidad una foto escaneada y por lo tanto, no se pueden contar las palabras de buenas a primeras. En realidad no es que estén mal hechos, sino que dependen de las limitaciones y la no disponibilidad del texto en formato digital.
  3. Los más o menos, que son el resultado del OCR de una imagen. O sea, son una foto, pero se pueden contar, aunque a veces con detalles y letras mal reconocidas.

Entonces, para el primer tipo, podemos usar la herramienta antes mencionada, o esta otra solución un poco más nerd que no requiere otros programas. Para ello, hay que pegar el siguiente código en la consola de JavaScript y ejecutarlo, (para ejecutarlo en Acrobat Reader se selecciona el código y se presiona control y enter al mismo tiempo… según me explican, yo lo probé con otro lector de PDF)

var cnt=0;

for (var p = 0; p < this.numPages; p++)

cnt += getPageNumWords(p);

console.println(«There are » + cnt + » words in this doc.»);

Para que les quede más claro, les dejo unas capturas de pantalla que me mandó la personita que me lo enseñó.

paso 1 paso 2 paso 3

Y creo que eso sería lo que iba a contarles. Hay otras herramientas (por ejemplo, Practicount & Invoice) pero no la conozco. Entiendo que presenta más funcionalidades y configurabilidad que podría resultar muy útil.

Ah, otra cosa: Anycount, viene incluido como función dentro del TO3000 del que les hablé en otra ocasión. Si lo compran  a través de este enlace, se supone que me toca comisión. No ha pasado nunca eso sí…o nadie me lee o nadie me cree. 🙂

Bonus track:

Me preguntaron por Facebook qué hacer en el caso de los hard copy,  pues nos vemos obligados  a contar a mano y perder mucho tiempo. Lamentablemente no es mucho lo que se puede hacer, pero lo que se me ocurre, sería:

1) Escanear a la mejor resolución posible.

2) Aplicar un buen OCR, por ejemplo AbbyFineReader. Si el presupuesto no alcanza para ello, probar con la herramienta que debe venir instalada con el escáner.

3) Al aplicar el OCR, centrarse solo en el texto, ya que eso es lo que estamos contando, por lo tanto, no habría que guardarlo ni como PDF escaneado ni como RTF, bastará solo con el texto sin formato.

4) Contar las palabras con Word o la herramienta de preferencia.

Como el éxito del procedimiento dependerá de la calidad del original, si el original es fax o una fotocopia de fotocopia y un texto todo reventado, saldrá más rápido y sano no contar las palabras. En ese caso, aplicar ojímetro y decirle al cliente que cobras N por x cantidad de palabras, y que calculas que saldrá y veces esa cantidad.  Sorry y gomen, Sole, pero eso es todo lo que se me ocurre.

 

 

 

 

12 comentarios

Archivado bajo CAT, Traducción

Contar palabras (1a parte)

Ya, ¿me echaron mucho de menos?

Pasa que la semana pasada estuve muy ocupado (aparte de poco ocurrente), por lo que tuve que dejarlos sin post. Pero no desesperen que ya estoy de vuelta, creo. Esta vez con algo de utilidad pública no necesariamente para los raros del japonés.

Contar las palabras y caracteres de distintos tipos de archivo es fundamental para el traductor, puesto que serán la base de lo que va a cobrar y lo que va a tardar. Entonces, para que no nos quedemos cortos (ni largos), veamos algunas formas de contar palabras con mayor o menor precisión.  Ahora, si el cliente nos sale por teléfono con que «son solamente como 2 páginas», hay que sospechar. Casi seguro que serán muchos miles de palabras y si cotizamos «dos paginitas», estaremos fritos (por lo demás, tampoco es recomendable cotizar sin ver al menos una muestra del texto).

Entonces, ¿cómo contamos las palabras o caracteres?

1. Para documentos en Word:

Es lo más sencillo, porque basta con usar la función incorporada. Pero hay que tener ojo de todas formas:

Si la versión de Word es anterior a 2007, las notas al pie, los cuadros de texto y similares serán olímpicamente ignorados. Lo que puede ser fatal a la hora de cotizar. Afortunadamente, eso ya no pasa desde Word 2007 (¿quién dijo que era malo?). Pero hay que acordarse de marcar la casilla final para que los incluya.

conteo de palabras

Conteo de palabras en español y japonés en Word

Lo bueno es que al diferenciar entre caracteres asiáticos y occidentales, podemos hacer una cotización más exacta. Si un texto japonés, que cobraremos por caracter tiene muchas palabras en romaji, al contarlas por carácter podríamos estar estafando al cliente sin querer.  Por ejemplo, el documento de la foto tiene 30 «palabras», combinando caracteres japoneses y palabras españolas, pero 108 caracteres en total.

Si tenemos Word 2003, no le creemos a Microsoft o necesitamos una estadística más detallada, podemos usar la herramienta «Complete Wordcount» eso sí una vez que la actualicen, porque está en proceso de renovación.  (Gratis… al menos hasta hace un tiempo).

Otra opción puede ser +Tools, un complemento gratuito para Wordfast. Tiene la ventaja de que permite un conteo en varios archivos a la vez y genera un informe con la estadística total e individual de los archivos:

Ejemplo de conteo con +Tools

Ejemplo de conteo con +Tools

La desventaja es que no diferencia entre los tipos de caracteres japoneses y occidentales, pero bueno, eso nos importa solo a unos pocos. Y si estamos en serio, podemos usar la función de estadísticas de MemoQ, que sí la hace, y aparte, nos muestra la cantidad de segmentos, porcentaje de coincidencias con nuestras memorias, etc. todo lo cual nos servirá a la hora de ponderar la carga de trabajo necesaria.

Estadísticas en MemoQ

Estadísticas en MemoQ

Ahora bien, si usamos todos los métodos antes mencionados en un mismo documento, veremos que suele haber disparidad en los resultados, con MemoQ siendo por lo general el más generoso en los conteos (los ejemplos de las fotos son aleatorios, no es tanta la diferencia, no se me asusten). Eso se debe a que los criterios para considerar qué es una palabra difieren según la herramienta. Para algunas, John’s puede ser sólo 1 palabra y para otros, dos. Por lo tanto, lo importante es ponerse de acuerdo con el cliente en el conteo.

Otro día vemos qué hacer para otros formatos.

3 comentarios

Archivado bajo CAT, Traducción, Uncategorized

TO3000

Normalmente cuando se habla del uso de la computación en el trabajo del traductor, se hace referencia a las herramientas de traducción asistida (CAT tools), a gestores terminológicos, reconocedores de voz o cualquier otro tipo de programa relacionado con aspectos lingüísticos. Sin embargo, existe una variedad de aplicaciones que no son tan famosas como las anteriores pero que pueden resultar tanto o más útiles: las programas administrativos.

Apenas empezamos a trabajar, empezamos a darnos cuenta de que hay que organizarse de algún modo:

  1. ¿Cúando debo entregar el trabajo?
  2. ¿Cuánto tengo que cobrar?
  3. ¿Qué trabajos he hecho ya para este cliente?
  4. ¿A este cliente le cobro de inmediato o a fin de mes?
  5. ¿Cuánto saldría el documento que me piden que cotice?

Al principio hacemos todo eso a mano, quizás en una agenda o con más suerte en un archivo excel escondido en algún recoveco de nuestra máquina. Con el tiempo nos damos cuenta de no nos está resultando tan bien como pensábamos, que se nos olvida cobrar, que no sabemos cuánto facturamos el mes anterior, que crear una a una nuestras facturas no es nada eficiente, etc. O sea, en el ámbito administrativo, no somos tan productivos como desearíamos, lo que nos quita tiempo para lo que realmente nos apasiona: traducir (y vivir de eso).

Ahí es donde aparecen los programas que les mencionaba recién. Para todas esas labores administrativas y tediosas, está TO3000 , de AIT software, Ucrania, creado por y para traductores. Precisamente por eso, se adapta fácilmente a nuestras necesidades. Yo lo uso desde la versión 8 y acabo de cambiarme a la versión 10.

Entre sus muchas gracias, está la creación de cotizaciones y facturas de estilo profesional con solo unos cuantos pasos. Además, incluye un software para contar palabras en distintos formatos (muy configurable), lo que ayuda una enormidad a la hora de sacar cuentas. También nos permite calcular en cosa de segundos lo que hemos ganado, lo que nos deben, lo que hemos gastado, etc. Si bien es un programa de pago, es una excelente inversión que se recuperará al poco tiempo, gracias al tiempo que nos permite ahorrar.

Aunque esta entrada suene a propaganda, soy un fiel y agradecido fan de este programa y lo recomiendo sin remordimientos. Además, el servicio técnico de post venta llega a ser emocionante: siempre responden a tiempo para solucionar cualquier inconveniente. No los entretengo más y los invito a bajar el demo…aquí.

 

4 comentarios

Archivado bajo CAT, Reseñas, Traducción

Across

Bueno, hace un buen tiempo ya, prometí que comentaría otra herramientas de traducción para los regalones. Así que aquí vamos, con la más bien desconocida Across. Este es un programa enorme  que, a diferencia de Wordfast Classic, no trabaja dentro de Word, sino que consiste en un entorno independiente, desde el cual los archivos traducidos son recreados, en el formato correspondiente, una vez terminados.

Cuando digo enorme, me refiero a la instalación, que duró más o menos media hora, cuando todo fue bien, en un netbook con XP. En Windows 7 me sale un error esotérico durante el proceso de instalación, el cual me impidió seguir adelante.  Aunque como es un programón, primero hay que instalar bases de datos SQL y otras cosas que suenan y se ven complicadas.

Al final, pude probarlo y se ve bastante bonito, es rápido y además cuenta con muchas opciones administrativas para la traducción, como por ejemplo plazos de entrega y estados de avance para cada documento. Otra particularidad es que segmenta originalmente por párrafos, lo que facilita el trabajo a la hora de fusionar o dividir oraciones al traspasarlas a otra lengua. Permite importar memorias en formato TMX sin grandes contratiempos, aunque para mi gusto un poco lentamente (aunque puede ser culpa del hardware, hay que ser justos).

También tiene varias alternativas de traducción automática en línea (intertran, systran y otros), que se despliegan [desafortunadamente] en Explorer, aunque uno tenga otro navegador predeterminado.  Posee además una función poco frecuente en otras herramientas es que cuenta la cantidad de palabras por las que nuestra traducción excede al original, o viceversa, lo que es muy útil cuando hay restricciones de espacio.

De todas formas, aunque se ve bastante atractivo y poderoso, no sé si vale la pena tanta parafernalia. Tendría que poder instalarlo en mi maquinita regalona y poder probarlo con mayor comodidad que la que puede dar un netbook de teclas minúsculas.

Así que eso no más. Si alguien se anima, que pruebe cuando tenga algo de tiempo. Total es gratis (aunque exige registrarse, a menos que se use el demo),

Les dejo algunas capturas de pantalla para que se hagan una idea.

El pase de diapositivas requiere JavaScript.

Add to FacebookAdd to DiggAdd to Del.icio.usAdd to StumbleuponAdd to RedditAdd to BlinklistAdd to TwitterAdd to TechnoratiAdd to Yahoo BuzzAdd to Newsvine

Deja un comentario

Archivado bajo CAT, Opiniones, Reseñas, Traducción

Datos útiles para traductores noveles (o veteranos creídos)

Hace un tiempo me compré unos librillos en EE.UU. usando el sistema de la casilla en Miami. La experiencia de compra fue un poco atadosa ya que como mandaron los libros por separado, los «simpáticos» del flete hicieron lo propio,  incrementándose así  el costo de la compra. Los e-mails que mandé pidiendo que hicieran un solo paquete cayeron en oídos sordos, o mejor dicho ojos imbéciles porque respondieron con ese tipo de mensajes que no ayudan en nada, tipo call center.

Pero bueno, la idea no era quejarse de eso (un poco sí, igual), sino que comentar las adquisiciones:

1. The Prosperous translator: Una compilación de consejos a traductores de todo el mundo, en formato de carta, formulados en conjunto por dos traductores exitosos, en los que se tocan muchos temas de extrema utilidad tanto para principiantes como para los no tanto. Con un estilo ameno, se tocan temas como el manejo de las críticas, las formas de conseguir mejores clientes y no me acuerdo qué más ahora pero seguro que era muy útil. El libro recopila los mensajes reales intercambiados por los autores, bajo el seudónimo de «Fire Ant & Working Bee», con los lectores de su sección homónima en el Translation Journal. O sea, aunque no es necesario comprar el libro, pues los consejos se pueden consultar en línea, yo prefiero la versión de papel, para irse informando en ratos de poca pega y despegados de la maquinita que tanto rato tenemos en frente.

2. How to succeed as a Freelance translator:  Este es más bien una guía paso a paso para ejercer nuestro trabajo de manera rentable y profesional, con consejos básicos y no tan básicos, que son fundamentales para principiantes pero que también resultan útiles para truchimanes más experimentados. De lectura amena, es una buena guía que explica las buenas prácticas que nos ayudarán a que mejore nuestro negocio interlingual. también muy recomendable.

Y eso por esta semana. Más cosillas otro día.
 

Add to FacebookAdd to DiggAdd to Del.icio.usAdd to StumbleuponAdd to RedditAdd to BlinklistAdd to TwitterAdd to TechnoratiAdd to Yahoo BuzzAdd to Newsvine

Deja un comentario

Archivado bajo Opiniones, Reseñas

Mayusculitis

Como hay que cumplir lo prometido, hoy nos toca tratar el mayúsculo tema de la «mayusculitis». Para el que no sepa, esta consiste en el abuso de las letras mayúsculas donde toda la vida se han usado minúsculas. Entre las causas de este flagelo ortotipográfico están principalmente la interferencia del inglés, que es muy propenso a escribir con mayúsculas hasta por si acaso: pronombres personales, días de la semana, los nombres de los meses, y numerosos otros elementos van tradicionalmente en mayúscula en la lengua anglosajona. Incluso tienen el verbo  «to capitalize«, que en una de sus acepciones quiere decir «escribir en mayúsculas»,  lo que normalmente los hispanohablantes no nos atreveríamos a decir como «mayusculizar», a menos que lo hagamos así entre comillas, como pidiendo permiso.

Así, es posible apreciar en muchas traducciones unas mayúsculas calcadas sin pudor del original. Es cierto que el uso de las mayúsculas en castellano es bastante complejo y lleno de reglas, excepciones y casos especiales, pero eso no justifica al traductor para abandonar el uso correcto. Además, en general en castellano es mucho menos «mayusculoso», ya que son menos los casos en que hay que usarlas.  Sin embargo, incluso en textos escritos originalmente en español, a veces abundan las mayúsculas por si acaso o con alguna intención de «dar importancia» a  lo que se escribe.

Me imagino que entre otra de las causas posibles está el aún muy extendido mito de que las mayúsculas no se acentúan,  lo que suele entenderse como una licencia para despreocuparse de las tildes. En realidad, antiguamente con las máquinas de escribir resultaba complicado y poco estético acentuar las mayúsculas y por eso, existía esa especie de permiso para no acentuarlas. Como gracias a los procesadores de texto actuales eso paso a la historia, la excusa ya no es válida.

Por otra parte, está el abuso de las mayúsculas en las redes sociales o los correos electrónicos. Los modales internetísticos dictan que escribir todo en mayúscula equivale a gritarle a tu lector, pero aún así hay muchos que no se dan por aludidos.

Un ámbito que nos permite tomar conciencia de la interferencia interlingüística en esto de las mayúsculas, es la traducción desde lenguas con sistemas de escritura diferente. Por ejemplo, el concepto de mayúscula no existe en japonés. Solo se pueden agrandar o achicar los caracteres, pero eso es solo un asunto estético y no ortográfico. Por lo tanto, al traducir de estos idiomas estamos obligados a tomar conciencia del uso correcto en nuestra lengua.

Como dijera Lázaro Carreter: «Ante la duda, minúscula«.

Add to FacebookAdd to DiggAdd to Del.icio.usAdd to StumbleuponAdd to RedditAdd to BlinklistAdd to TwitterAdd to TechnoratiAdd to Yahoo BuzzAdd to Newsvine

4 comentarios

Archivado bajo Opiniones

Una pequeña recensión sobre la nueva ortografía de la RAE

Hace algunos meses la noticia de las nuevas reglas ortográficas presentadas por la RAE causó cierto revuelo en los medios de comunicación. Que «solo» se puede escribir siempre como en «Han Solo» (sin tilde, por si a alguno se le escapa), que la ch ya no califica como letra independiente y que conviene que la «y» no sea más «i griega» sino que se llame «ye», fueron algunos de las novedades que acapararon la atención.  Pero bueno, estemos o no de acuerdo con tales novedades, la publicación donde aparecen merece una entrada en este humilde blog.

Hay que reconocer que tras perpetrar un diccionario léxico plagado de definiciones circulares, subjetivas o simplemente inútiles,  la RAE desde un tiempo a esta parte ha publicado varias obras indispensables para  el traductor, como el DPD, la gramática y, ahora,  la ortografía. Hoy nos ocupamos de esta última, porque es la más nueva y porque es mi más reciente adquisición (12.900 piticlines en su librería amiga).

Directo al grano, diría que está bastante buena esta ortografía, ya que abarca casos bien específicos de dudas que a veces cuestan resolver. Por ejemplo, una vez le decía a mi hermano que yo pensaba que los nombres de enfermedades iban en minúscula, a diferencia de como los veía en unos escritos con los que él tenía que trabajar. Bueno, resulta que este librito tiene su propia sección sobre las enfermedades en el apartado del uso de mayúsculas. Y claro, van con minúsculas porque son sustantivos comunes. ¿No decía yo? Otro día hablaremos de la «mayusculitis».

Además, me ha sacado de apuro en otras dudas que me han agobiado últimamente, sobre temas trascendentales para la humanidad, como por ejemplo la concurrencia de determinados signos ortográficos. Al traducir en ocasiones inconscientemente calcamos usos ortográficos de la lengua de origen. Algún profe de inglés me enseño años ha que después de un signo de interrogación no puede venir ningún signo ortográfico…y aunque no sé que tan cierto sea eso en el idioma gringo, al menos sé que en castellano no lo es. Todo gracias a este libraquito.

El único pero que se me ocurre por ahora, es que se echa de menos un índice alfabético, ya que hay que hacer profundos ejercicios de abstracción para buscar dentro un índice temático de tantas páginas. Igual, una buena obra de consulta para los regalones.

Add to FacebookAdd to DiggAdd to Del.icio.usAdd to StumbleuponAdd to RedditAdd to BlinklistAdd to TwitterAdd to TechnoratiAdd to Yahoo BuzzAdd to Newsvine

4 comentarios

Archivado bajo Opiniones, Reseñas

Cuadros de texto, pepetés malditos y el hombre tigre al rescate

Pepetés, ppts o infames presentaciones en Powerpoint. No importa cómo los llamemos, pero muchos traductores hemos aprendido a detestarlos. Ya sea porque no es fácil contar las palabras, porque nos toma mucho tiempo traducirlos o porque suelen estar mal hechos y lo que serían 5 minutos de edición se pueden transformar en 50 de frustración. Lo mismo pasa con los famosos cuadros de texto en Word, que aparte de ser un «dolor en el traste», hasta Office 2003 no se incluían en el conteo de palabras, por lo que un descuido podía hacernos cobrar de menos.

Pero bueno, al final lo que cuenta es que seamos capaces de traducirlos y bien. Si tenemos Trados, Wordfast Pro o algo parecido, en realidad ya no es un problema, ya que dichos programas extraen el texto traducible y después recrean la versión traducida. Si sólo tenemos Wordfast Classic, igual podemos traducir aunque el proceso es un tanto artesanal (aunque igual medio mágico).

Aquí es donde llega el hombre tigre al rescate. ¿Y ese quién es?

Bueno, es el werecat, una pequeña macro de Word que permite extraer el texto de un .ppt o de todos los cuadros de texto de un .doc . Esto nos permitirá traducir en Word a nuestras anchas y después mandar el texto de vuelta al ppt o a los cuadros de texto correspondientes.  Si bien es un programita que ya no se desarrolla más porque fue creado para Office 2003, en mi experiencia suele funcionar igual de bien con 2007. Las pocas veces que ha fallado he sido capaz de resolver el problema con un poco de observación (arreglando alguna pifia en el ppt original, por ejemplo).

Así que vale la pena probarlo…aunque como dice en su página, no se garantiza nada (igual es un caballo regalado, así que sería un descaro reclamar).

(No olviden leer bien las instrucciones de uso y qué es lo que puede y no puede hacer)

3 comentarios

Archivado bajo CAT