January 25, 2012

j'ecris un document en anglais. ou bien c'est f-- qui l'crit, ou r---, ou f-------. ensuite, on envoie ce document a la trad. bien sur, on écrit en dita. et ce dita là, quand il est envoyé a la trad, est segmenté. que veut dire "segmenté" ? vous savez, dans dita--ou plus precisement, dans notre implementation de dita--, le document à traduire est decoupé et transferré dans une base. comment c'est découpé ? souvent par phrases. et c'est donc les phrases qui sont transferrés dans la base. une base des phrases. la "phrase base" si vous voulez. bien sur, dans les document techniques, on peut découper sur des mots clèfs, ou des bouts de code. heureusement, le format dita est riche, et permet de faire ces types de découpage. le plus souvent, néanmoins, la segmentation est par phrases. quand les traducteurs recoivent cette phrase base, ils traduisent chaque phrase séparément. ils travaillent dans une pièce souterraine, mal éclairée, penchés sur leur bureaux de camping pliables. c'est souvent des handicappés mentales, en fait. des autistes, plutôt, dont le seul capacité est de traduire l'anglais en italien, en allemand... le mec se croit Silvio Berlusconi, ou Napoleon. et pour tout dire, il est très mal payé. la localization parle toujours des dollars trad, dollars trad, mais en réalité c'est des centimes. ces les économies, vous savez. donc ce mec, il voit phrase après phrase sur son écran, et il doit vite la traduire en italien, ou japonais, à partir d'où il recoit la phrase suivante, un torrent sans relache, produit par les doigts des developpeurs tapant dans les .properties ou des rédacteurs dans les .dita. au retour, toutes les trois semaines, on reçoit un travail bien fait : une nouvelle phrase base, mais cette fois en français. il faut maintenant reconstituer le document d'origine, mais avec les phrases anglaises replacées par des phrases françaises. comment fait-on ? en effet, le système est bien fait. il prend le document anglais, il en retire tout le texte (sauf les mots clès), et, en utilisant les phrases anglaises comme index, il cherche la phrase base française pour trouver les phrases françaises à mettre à la place. c'est ainsi qui est reconstitué le document francais. mais, un problème apparaît quand on met à jour le document anglais avec des phrases qui one été ajoutées depuis le départ de la phrase base dans des pièces sombres des traducteurs. en effet, ce croisement des données crée un document anglais qui, une fois vidé de son texte, contient plus de place que prévu par la base des phrases françaises qui revient de la trad. et le système donc, en essayant de reconstruire le document français, trouve des endroits où il lui manque une phrase pour combler un vide du document d'origine. quand le document est publié, on voit donc des vides... des phrases entières blanches, des points sans lignes, des titres vides. c'est ce qu'on appelle les "trous de traduction". et c'est pour cela qu'on essaie d'éviter de mettre à jour le document anglais une fois que la traduction à commencé.

August 18, 2010

was trying to remember name of that famous guy, in this order:

  1. Hippie Z

  2. Lou Breen

  3. Jimmie Morris

  4. Jimmie Carlsson

  5. Jimmy Hendrix

That's him. Jimi Hendrix.

March 03, 2010


December 16, 2009

Eglantine & Eglington

October 15, 2009

La baisse du TVA est en constante augmentation

La baisse du TVA est en constante augmentation

malgré les efforts des forces de l'ordre à subvenir

aux besoins de la communauté internationale

à bouleverser des mentalités dans les années quatre-vingt

lors de la prise de contrôle du pouvoir public

par la conjoncture éco-sociale actuellement

transmissible de personne en personne ou de

personne en passe navigo en passe navigo en passe navigo

September 18, 2009

Official Google Blog: Teaching computers to read: Google acquires reCAPTCHA

Official Google Blog: Teaching computers to read: Google acquires reCAPTCHA

At the post linked above, Google says it uses human answers to captchas, which are intentionally hard for computers to read, to make text in captchas easier for computers to read.

It follows, then, that more computers will soon be able to crack captchas.

September 11, 2009

How to read on the web

Here's a tip for reading on the web: pick a sentence and read it. I've found that reading one sentence from start to finish, rather than bouncing from keyword to keyword in a paragraph, aids comprehension.

August 06, 2009

The blank's early

June 24, 2009

What becomes of the dead's gmail accounts

Following any legally dictated purge period, the account passes in encrypted form to the deceased's estate, or, in case of absence of descendants, to the federal or national government (depending on laws in effect for the country) of the deceased's most recent primary residence. There is no legal provision for the transfer of decryption credentials associated with this account, as these are not stored by the company and thus in the responsibility of the deceased to arrange for example in a last will and testament.

August 07, 2008

Speaking Freely

"What happened with the Great Savras(?) and for All That Are Rising was that I also thoroughly enjoy those books and they were then shown to be too simplistic to me in a later lecture. Morning with the Simple Captain with Emma and almost tempted to say that it is not a book that should be part of the English Canon. I think I am going to resist the tem(?)"

spoken through SpinVox

Recent archives

Inforotica

Books

McDonald's