Tout d'abord, Apertium gagne en popularité. Par exemples, l'université de Reykjavík participe au développement d'Apertium et le très diffusé quotidien espagnol El País consacre un long article au programme de traduction libre.
Ensuite, Apertium a été sélectionné pour le Google Summer of Code (GSOC). Neuf étudiants dont deux de Grenoble participent à l'événement.
Finalement, les développeurs ont publié en version stable de nombreuses nouvelles paires dont l'espagnol-occitan, catalan-occitan, espagnol-basque, anglais-espéranto, anglais-galicien, anglais-gallois, portugais-galicien, portugais-catalan.
Notons que des développeurs pour de nouvelles paires comme par exemple le français-espéranto sont les bienvenus. Vous pourrez ainsi vous baser sur entre autres les paire espagnol-français et d'autre part espagnol-espéranto, catalan-espéranto, anglais-espéranto. De plus la version français-espagnol est passée en version 0.9. Apertium se base sur un moteur écrit en C++, et cinq fichiers XML par paires de langues.Si vous désirez créer une nouvelle paire de langue, vous ne devez pas connaître le C++, mais simplement pouvoir utiliser un éditeur de texte pour manipuler les fichier XML.
Un fichier monolingue pour chaque langue : ceux-ci contiennent des modèles qui indiquent comment les mots varient (la conjugaison pour les verbes, la formation du pluriel pour les noms, etc.) et une liste de mots avec le modèle associé. Un fichier bilingue qui contient une liste de mot dans une langue et sa traduction dans l'autre. Deux fichiers de transfert qui indiquent les règles pour passer d'une langue à l'autre et un autre fichier en inversant le rôle de langue cible et source.
Les personnes intéressées par le développement sont invitées à nous rendre visite sur le canal IRC #apertium hébergé sur irc.freenode.org. D'expérience, je peux vous dire que l'accueil y est très amical et les développeurs sont très patients dans leurs explications aux nouveaux.
Aller plus loin
- DLFP Apertium fr-es 0.8 (18 clics)
- Wiki d'Apertium (7 clics)
- Apertium dans El Pais (4 clics)
- Projets Apertium pour le GSOC (5 clics)
- Précédente dépêche (Apertium français-espagnol 0.8.0) (5 clics)
# test
Posté par Vincent Meurisse (site web personnel) . Évalué à 8.
Ce traducteur est assez capable de parler une langue compréhensible.
[^] # Re: test
Posté par Grégory SCHMITT . Évalué à 2.
[^] # Re: test
Posté par B16F4RV4RD1N . Évalué à 5.
;)
Ce qui serait pas mal, c'est d'avoir une version esperanto/français, ainsi cela ouvrira une traduction peut-être plus fidèle du français vers l'allemand ou l'anglais et vice versa, en passant par l'esperanto (il me semble qu'un logiciel de traduction utilise déjà cela)
Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it
[^] # Re: test
Posté par Youssef Oualmakran (site web personnel) . Évalué à 2.
# Langues indo-européennes
Posté par Axioplase ıɥs∀ (site web personnel) . Évalué à 3.
Y a bien le basque comme intrus, mais je crois que ce logiciel, avec son système actuel, sera à tout jamais incapable de faire du japonais, du coréen ou du thai (sans parler de bien d'autres langues d'Asie).
Exemple en japonais,
− okâsan ni mizu wo irete sasi agemasita. (J'ai versé de l'eau à ma mère)
− inu ni mizu wo irete yatta (j'ai versé de l'eau à mon chien)
Ne changent que le receveur (mère/chien) et ça suffit pour changer le groupe verbal. Et bien que nul part je n'ai écrit "je", le sujet est implicite.
Pis encore!
− okâsan ni mizu wo irete moratta (ma mère m'a versé de l'eau).
− okâsan ni mizu wo irete moratta (on a versé de l'eau pour ma mère).
Et voila une belle ambiguité impossible à résoudre sans contexte. Il gère-tu le contexte, le logiciel ci-dessus ?
Au final, je ne dénigre pas le logiciel, loin de là, je le trouve même plutôt sympa. Je fais juste remarquer qu'il est adapté (du moins, me semble-t-il) aux langues "connues" qui sont en fait de très, très mauvais représentants des langues du monde (y compris à l'oral, où nous n'avons pas de tons)
[^] # Re: Langues indo-européennes
Posté par JoeltheLion (site web personnel) . Évalué à 2.
[^] # Re: Langues indo-européennes
Posté par Youssef Oualmakran (site web personnel) . Évalué à 4.
1)De nombreuses langues asiatiques, comme par exemple les langues indo-aryennes, pourraient bien fonctionner avec Apertium. De nombreuses langues dans ce groupe sont en effet proches linguistiquement.
2) Nous n'avons pas encore traité les registres de politesse, en grande partie parce que nous n'avons personne qui s'y est intéressé. Il y a un système de traduction automatique open-source pour l'anglais-japonais que vous pourriez peut-être consulter. Ce logiciel s'appelle 'ja2en' et est basé sur la technologie LOGON. http://cl.aist-nara.ac.jp/~eric-n/papers/open-source-mt-TMI-(...)
3)Nous tenons compte du contexte en réalisant des unités formées de plusieurs mots. Nous aimerions bien travailler sur un module offrant une méthode de sélection lexicale plus puissante. Mais ... jusqu'à présent, nous n'avions pas encore eu vraiment besoin de cela, car nous travaillons généralement sur des langues proches sur le plan linguistique.
4)Si vous jetez un oeil à l'incubateur, https://apertium.svn.sourceforge.net/svnroot/apertium/trunk/(...) vous trouverez des langues moins "connues" comme l'ossetien, le dhivedi ou le kurde (néanmoins indo-européen).
5)Apertium accepte toujours bien volontiers de nouveaux développeurs. Donc si vous avez une quelquonque idée sur la manière d'améliorer Apertium ou si vous avez une quelconque suggestion, nous serions ravis d'en prendre connaissance
[^] # Re: Langues indo-européennes
Posté par S. Christian . Évalué à 1.
Voici l'un de ses textes:
http://claudepiron.free.fr/articlesenfrancais/langueoccident(...)
Donc l'espoir d'une version espéranto - chinois et vice-versa n'est pas vain apparemment.
Pour le japonais, c'est effectivement une autre paire de manches, bien que la grammaire soit assez régulière aussi.
Pour ceux que l'espéranto titille et qui manquent de motivation pour commencer (ou simplement pour chercher de l'info):
http://claudepiron.free.fr/index.htm
http://claude-piron.ch/francaisindex.htm
et l'excellentissime FAQ de la Société Québécoise d'Espéranto:
http://www.esperanto.qc.ca/fr/questions
[^] # Re: Langues indo-européennes
Posté par Axioplase ıɥs∀ (site web personnel) . Évalué à 1.
La grammaire « régulière » du japonais (et celle du coréen, encore pire selon moi) est une horreur. Autant, passer d'une de ces deux langues à l'autre est "aisé", autant passer par −ou vers− une langue non agglutinante, non contextuelle et dépourvue de variations morphologiques dues à la politesse est une ambition computationnelle que j'ai laissée tomber.
J'ai trouvé bien plus simple d'apprendre les langues que d'apprendre à les traduire :)
Quand à ma possible participation au projet, pas dans l'immédiat. J'ai justement renoncé il y a un bail à un troisième cycle en linguistique informatique, et c'est pas encore revenu à l'ordre du jour. Mais je garde le projet en tête pour plus tard.
# Paires de langues
Posté par teoB . Évalué à 2.
N'avez vous pas peur du nombre de paires qu'il faudrait développer, de l'inégalité des traductions qui pourraient en découler ? De plus certaines langues qui n'auraient que peu de paires, pourraient nécessiter de passer par plusieurs langues. Est-il prévu une évolution du logiciel qui pourrait utiliser une langue intermédiaire ? Est-ce que ça pourrait être l'espéranto (je n'y connaît rien, mais il m'avait semblé avoir lu que c'était une langue bien structurée) ?
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.