Toute personne apprenant une langue s'est retrouvée un jour face à la question « Mais comment diable utilise-t-on ce mot/cette expression ? ». Le projet Tatoeba a été fondé pour répondre au besoin de pouvoir rapidement trouver des phrases illustrant un mot ou une expression. Le tout s'articule autour d'un site web [http://tatoeba.org], où chacun peut venir piocher des phrases dans les langues qui l'intéressent et, une fois inscrit, ajouter ses propres phrases, mais aussi traduire, corriger celles déjà existantes.
C'est d'ailleurs dans cet aspect collaboratif que réside tout l'intérêt de Tatoeba : l'ensemble des phrases a été créé/traduit par des êtres humains. Ainsi, on peut non seulement trouver des phrases « naturelles », mais aussi poser des questions sur les phrases déjà présentes, afin de savoir si telle ou telle variation est correcte, dans quel cas on utiliserait cette phrase plutôt qu'une autre, etc.
Nous avons pour l'instant plus de 400 000 phrases réparties sur 53 langues et environ 4000 audios qui proviennent d'une collaboration avec le projet Shtooka. Pour ce qui est des licences, l'ensemble des phrases et audios sont sous CC-BY2.0/FR et le site en lui même est sous AGPL v3.
Apertium intègre le premier traducteur automatique breton-français
L'Office de la Langue Bretonne a présenté le lundi 18 Mai 2009 le premier traducteur automatique breton-français, développé conjointement avec l'université espagnole d'Alicante, dans le cadre du système de traduction libre Apertium (sous licence GPL).
Apertium était initialement destiné à traduire entre des langues suffisamment voisines, mais a réussi aujourd'hui à créer des paires linguistiques plus éloignées. Il a bénéficié du soutien financier du gouvernement espagnol et du gouvernement autonome de Catalogne, ainsi que de la contribution de plusieurs entreprises et universités européennes.
Apertium était initialement destiné à traduire entre des langues suffisamment voisines, mais a réussi aujourd'hui à créer des paires linguistiques plus éloignées. Il a bénéficié du soutien financier du gouvernement espagnol et du gouvernement autonome de Catalogne, ainsi que de la contribution de plusieurs entreprises et universités européennes.
[GIMP] G'MIC évolue et s'internationalise
Salut à tous,
Le greffon G'MIC pour GIMP continue son petit bonhomme de chemin, avec la version 1.3.1.5 qui est sortie, et qui comporte pas mal de nouveautés, ajoutées depuis mon dernier journal sur le sujet. Je détaille ici quelques unes de ces nouvelles fonctionnalités. Pour info, G'MIC est (entre autres) un greffon libre multi plate-forme pour GIMP qui propose un grand nombre de filtres (environ une centaine) pour traiter des images de manière diverse.
Le greffon G'MIC pour GIMP continue son petit bonhomme de chemin, avec la version 1.3.1.5 qui est sortie, et qui comporte pas mal de nouveautés, ajoutées depuis mon dernier journal sur le sujet. Je détaille ici quelques unes de ces nouvelles fonctionnalités. Pour info, G'MIC est (entre autres) un greffon libre multi plate-forme pour GIMP qui propose un grand nombre de filtres (environ une centaine) pour traiter des images de manière diverse.
Journal Méthodo localisation / Actu Mandriva
/!\ Journal Dable Effect
J'ai récemment commencé à bosser sur la localisation de 2 logiciels libres afin de pouvoir les mettre à disposition en interne, les différences méthodologiques sont assez frappantes :
- d'un côté un responsable des traductions qui fait l'interface entre les traducteurs et le svn, l'interface se traduit via un .ts (équivalent du .po) avec Qt Linguist tandis que la doc se compose d'une série de ficher latex. La prise en main se fait rapidement pour l'interface (…)
J'ai récemment commencé à bosser sur la localisation de 2 logiciels libres afin de pouvoir les mettre à disposition en interne, les différences méthodologiques sont assez frappantes :
- d'un côté un responsable des traductions qui fait l'interface entre les traducteurs et le svn, l'interface se traduit via un .ts (équivalent du .po) avec Qt Linguist tandis que la doc se compose d'une série de ficher latex. La prise en main se fait rapidement pour l'interface (…)
Publication de Anwiki 0.1.0 alpha 1
Après un an de développement par notre camarade anw, voici enfin la sortie de la première version de Anwiki (sous licence GNU GPL 3).
Anwiki est un projet destiné à gérer simplement les contenus multilingues. Il s'agit donc d'un wiki mais concentré sur les processus d'internationalisation et de traduction : traduction directement dans les pages du wiki, édition et internationalisation de code PHP, définition de contenus multilingues fortement structurés, architecture de composants modulaires.
Techniquement le programme est codé en PHP5/MySql ; il repose principalement sur un algorithme permettant de détecter les différences entre deux versions d'un document XML, et d'adapter les modifications aux traductions existantes, permettant ainsi de mettre à jour chaque bloc modifié.
Le projet est encore en version expérimentale, mais le développeur assure que le projet est assez mature pour que les fonctions de localisations soient testées par tout un chacun, afin d'effectuer des retours. Anwiki recherche également un designer, afin d'améliorer les modèles PHP, qui ne sont que très basiques et non conformes aux standards pour le moment.
Anwiki est un projet destiné à gérer simplement les contenus multilingues. Il s'agit donc d'un wiki mais concentré sur les processus d'internationalisation et de traduction : traduction directement dans les pages du wiki, édition et internationalisation de code PHP, définition de contenus multilingues fortement structurés, architecture de composants modulaires.
Techniquement le programme est codé en PHP5/MySql ; il repose principalement sur un algorithme permettant de détecter les différences entre deux versions d'un document XML, et d'adapter les modifications aux traductions existantes, permettant ainsi de mettre à jour chaque bloc modifié.
Le projet est encore en version expérimentale, mais le développeur assure que le projet est assez mature pour que les fonctions de localisations soient testées par tout un chacun, afin d'effectuer des retours. Anwiki recherche également un designer, afin d'améliorer les modèles PHP, qui ne sont que très basiques et non conformes aux standards pour le moment.
Journal Transifex: libérer votre plateforme l10n
Une des problématique majeure du logiciel libre concerne la localisation des logiciels.
Aujourd'hui, la plupart des logiciels libres s'appuient sur les facilités fournit par Gettext. Si les traducteurs disposent d'outils éprouvés pour traiter les fichiers de traduction en local, il n'en est pas de même au niveau de la collaboration entre traducteurs.
Si certains "gros" projets de traductions sont bien rôdés, d'autres avec moins de moyens font appel à une plateforme l10n pour simplifier leur tâche.
Une des plateformes de (…)
Aujourd'hui, la plupart des logiciels libres s'appuient sur les facilités fournit par Gettext. Si les traducteurs disposent d'outils éprouvés pour traiter les fichiers de traduction en local, il n'en est pas de même au niveau de la collaboration entre traducteurs.
Si certains "gros" projets de traductions sont bien rôdés, d'autres avec moins de moyens font appel à une plateforme l10n pour simplifier leur tâche.
Une des plateformes de (…)
Apertium français-espagnol 0.8.0 vient de sortir
Le monde du logiciel libre ne compte que très peu de solutions de traduction automatique :
Apertium est une plateforme de traduction automatique libre et d'outils linguistiques conçue initialement pour des langues proches, comme par exemple la paire catalan - espagnol. La version 0.8.0 de la paire français-espagnol est sortie le 21 février 2008. Cette paire a bénéficié du soutien de l'entreprise Eleka Ingeniaritza Linguistikoa et a été développée par Prompsit.
- OpenLogos, projet peu actif ;
- Moses, qui réalise des traductions automatiques basées sur des statistiques ;
- Apertium, projet en GPL reposant sur une communauté active.
Apertium est une plateforme de traduction automatique libre et d'outils linguistiques conçue initialement pour des langues proches, comme par exemple la paire catalan - espagnol. La version 0.8.0 de la paire français-espagnol est sortie le 21 février 2008. Cette paire a bénéficié du soutien de l'entreprise Eleka Ingeniaritza Linguistikoa et a été développée par Prompsit.
Le libre et les mémoires de traduction
Dans le monde de la traduction professionnelle, vous savez, les gens qui vous produisent des notices tellement bien écrites que, si vous avez le choix, vous préférez les lire en anglais, eh bien dans ce monde-là, il existe un outil intéressant (en fait, il y en a plusieurs, mais l'article se concentre sur l'un d'eux) : la mémoire de traduction.
Contrairement à ce que son nom pourrait suggérer, il s'agit bien d'un logiciel. Celui-ci permet aux traducteurs d'enregistrer au format TMX, un format XML standardisé et ouvert, la concordance entre un segment dans une langue source et un segment dans une langue cible.
Décrit ainsi, cela ne semble pas vraiment intéressant ? Vous vous demandez peut-être ce que cela apporte par rapport aux bibliothèques Gettext (NdM : voir les entrées Fuzzy ) ? Vous ne voyez pas en quoi cela aide un traducteur ?
Eh bien, lisez le reste de l'article.
Le système que je propose, Mémoires Libres, est utilisable dès à présent, il n'attend que des contributeurs et c'est le but de cette dépêche que d'en trouver. Bien sûr, je vais aussi contacter les listes de diffusion liées à la traduction de logiciels libres. N'hésitez pas à critiquer le projet, que ce soit au niveau du site Web, de son organisation ou autre chose, ça lui permettra d'avancer.
NdM : KBabel et POedit disposent aussi d'outils de recherche dans des dictionnaires de chaînes traduites. Le projet KAider (devenu Lokalize) ainsi que la présentation ci-dessous montrent ce qu'apportent des mémoires de traduction en plus.
Contrairement à ce que son nom pourrait suggérer, il s'agit bien d'un logiciel. Celui-ci permet aux traducteurs d'enregistrer au format TMX, un format XML standardisé et ouvert, la concordance entre un segment dans une langue source et un segment dans une langue cible.
Décrit ainsi, cela ne semble pas vraiment intéressant ? Vous vous demandez peut-être ce que cela apporte par rapport aux bibliothèques Gettext (NdM : voir les entrées Fuzzy ) ? Vous ne voyez pas en quoi cela aide un traducteur ?
Eh bien, lisez le reste de l'article.
Le système que je propose, Mémoires Libres, est utilisable dès à présent, il n'attend que des contributeurs et c'est le but de cette dépêche que d'en trouver. Bien sûr, je vais aussi contacter les listes de diffusion liées à la traduction de logiciels libres. N'hésitez pas à critiquer le projet, que ce soit au niveau du site Web, de son organisation ou autre chose, ça lui permettra d'avancer.
NdM : KBabel et POedit disposent aussi d'outils de recherche dans des dictionnaires de chaînes traduites. Le projet KAider (devenu Lokalize) ainsi que la présentation ci-dessous montrent ce qu'apportent des mémoires de traduction en plus.
Forum général.cherche-logiciel Wiki/cms : synchro de contenu multilingue
Bonjour,
Je cherche une application (wiki, cms...) permettant de coordonner efficacement les traductions de contenus à évolution rapide.
En effet, il est très compliqué de maintenir à jour les traductions d'un site web multilingue sur lequel travaillent plusieurs éditeurs et traducteurs.
Idéalement, l'application devrait permettre :
- De créer de nouvelles pages dans une langue de départ
- De traduire une page existante vers une autre langue, et de définir son statut comme "traduction à jour"
- Lors de l'édition (…)
Je cherche une application (wiki, cms...) permettant de coordonner efficacement les traductions de contenus à évolution rapide.
En effet, il est très compliqué de maintenir à jour les traductions d'un site web multilingue sur lequel travaillent plusieurs éditeurs et traducteurs.
Idéalement, l'application devrait permettre :
- De créer de nouvelles pages dans une langue de départ
- De traduire une page existante vers une autre langue, et de définir son statut comme "traduction à jour"
- Lors de l'édition (…)
Journal Traduction....
Où l'on apprend que Microsoft, dans son souci de favoriser les langues régionales, va traduire Office en Alsacien :
http://www.lemonde.fr/web/article/0,1-0@2-651865,36-790691,0(...)
Une bonne remarque, hélas peu développée, dans la conclusion "Il faudrait aussi penser à traduire les logiciels libres !".
Je pense justement que les LL sont des bons outils de développement des langues régionales (Corse, Breton, Basque, Alsacien....), malheureusement il y a trop peu de traductions en cours, et il faudrait les encourager.
Connaissez-vous des projets de traduction, d'Openoffice par (…)
http://www.lemonde.fr/web/article/0,1-0@2-651865,36-790691,0(...)
Une bonne remarque, hélas peu développée, dans la conclusion "Il faudrait aussi penser à traduire les logiciels libres !".
Je pense justement que les LL sont des bons outils de développement des langues régionales (Corse, Breton, Basque, Alsacien....), malheureusement il y a trop peu de traductions en cours, et il faudrait les encourager.
Connaissez-vous des projets de traduction, d'Openoffice par (…)
Journal Gnome en breton ?
Bonjour tout le monde !
Juste pour dire à tous les utilisateurs de gnome bretonnants qui liront ce journal (oula ça fait pas beaucoup...) que je recherche le maximum de personnes capables de traduire un peu.
Gnome est traduits en plusieurs dizaines de langues dont le breton. Je suis à l'heure actuelle le seul traducteur dans notre langue et ya tellement de choses à faire.
Il n'y a aucune obligation de travail, mais concentrer les efforts dans un premier temps (…)
Juste pour dire à tous les utilisateurs de gnome bretonnants qui liront ce journal (oula ça fait pas beaucoup...) que je recherche le maximum de personnes capables de traduire un peu.
Gnome est traduits en plusieurs dizaines de langues dont le breton. Je suis à l'heure actuelle le seul traducteur dans notre langue et ya tellement de choses à faire.
Il n'y a aucune obligation de travail, mais concentrer les efforts dans un premier temps (…)