Apertium intègre le premier traducteur automatique breton-français

Posté par  . Modéré par patrick_g.
9
22
mai
2009
Communauté
L'Office de la Langue Bretonne a présenté le lundi 18 Mai 2009 le premier traducteur automatique breton-français, développé conjointement avec l'université espagnole d'Alicante, dans le cadre du système de traduction libre Apertium (sous licence GPL).

Apertium était initialement destiné à traduire entre des langues suffisamment voisines, mais a réussi aujourd'hui à créer des paires linguistiques plus éloignées. Il a bénéficié du soutien financier du gouvernement espagnol et du gouvernement autonome de Catalogne, ainsi que de la contribution de plusieurs entreprises et universités européennes. Grâce à une bourse de recherche octroyée par l'Université d'Alicante, l'Office de la langue Bretonne a pu déployer un jeune technicien brittophone, Gwenvael Jequel, qui a pu collaborer avec Francis Tyers, développeur de l'équipe d'Apertium.

Dans sa première version, cet outil est capable de reconnaître et d'analyser 85% du vocabulaire de la langue bretonne et atteint un taux de correction de 55% par rapport à des traductions de référence. Son modèle de développement libre promet d'améliorer ses performances dans les prochaines versions, et d'intégrer le breton dans de nouvelles paires, plus particulièrement galloises, espagnoles et anglaises.

Un service de traduction web est disponible à l'adresse http://xixona.dlsi.ua.es/~fran/breton/troer/index.php. L'Office de la Langue Bretonne envisage de le rendre disponible aux côtés de TermOfis et de KerOfis avant l'été 2009.

Aller plus loin

  • # Dispar !

    Posté par  . Évalué à 5.

    E-giz-se e c'hellin skrivañ e brezhoneg ha lakaat va zestenn er meziant-se da vezañ troet.

    résultat : Comme ça je pourrai écrire en breton et me mettre texte dans ce logiciel à être tourné.

    Ce n'est pas encore du Anjela_Duval, mais il y a de l'idée…
    • [^] # Re: Dispar !

      Posté par  . Évalué à 3.

      On sent quand même les 45% manquants.

      « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

  • # Suis je le seul ?

    Posté par  (site web personnel) . Évalué à 1.

    Suis je le seul à trouver étrange qu'il n'y ai pas des paires du genre Français-Anglais, Allemand-Français, Allemand-Anglais ou Allemand-Espagnol ?

    Il me semblait que dans la vie de tout les jours, dans le commerce international, dans les réalisation technique et autre, ces paires de langues sont bien plus utile que le Français-Breton ou le Galicien-Espagnol. Bon pour le Espéranto-Anglais, ça peut servir à la limite à comprendre la petite poignée de personne qui croient encore que cette langue non naturelle est l'avenir.

    Bon tout n'est pas perdu : le google summer of code nous apportera en paire de langue deux dialectes Norvégien : Norwegian Nynorsk-Norwegian Bokmål.

    Bon je sais on va me dire : si t'es pas content contribue. Et je répondrais : Si j'en ai besoin c'est que je ne peux pas forcement contribuer.

    Pour ce genre de paires largement répandu, une interface web de contribution pourrait être sympa. Un truc du genre : Liste des mots non traduit vers tel langue où l'on pourrait mettre en plus des traduction, les contexte dans lequel elle arrive (il me semble que Apertium gère les contexte aussi ?).

    Sinon pour le reste j'applaudis ce projet qui montre encore que le libre n'est pas juste un jouet pour geek mais sait faire de vrais grosses applications utiles à tout le monde avec une véritable recherche en terme d'algorithme (je parle d'algorithme de traduction là). D'ailleurs il serait marrant d'avoir un comparatif entre les capacité de traduction de l'algorithme de google, de reverso et apertium afin de pourvoir juger de leur qualité les uns par rapport aux autres de manière chiffrée.
    • [^] # Re: Suis je le seul ?

      Posté par  (site web personnel) . Évalué à 5.

      la petite poignée de personne qui croient encore que cette langue non naturelle est l'avenir.

      C'est quoi une langue naturelle ? Une langue qui pousse dans les arbres ?

      L'association LinuxFr ne saurait être tenue responsable des propos légalement repréhensibles ou faisant allusion à l'évêque de Rome, au chef de l'Église catholique romaine ou au chef temporel de l'État du Vatican et se trouvant dans ce commentaire

      • [^] # Re: Suis je le seul ?

        Posté par  (site web personnel) . Évalué à 2.

        une langue qui n'a pas été inventé mais qui est une évolution normale des langues ancienne et que des gens apprennent à la naissance. Tu connais beaucoup de gens qui parlent esperanto avec leurs enfants ?

        Et puis je doute qu'il y ai un argot en esperanto, alors que le Français, le Russe, l'Anglais, l'Espagnol et bien d'autre langue en sont doté.

        Je veux bien que l'Esperanto soit une langue simple étudier dans sa conception pour être le plus accessible et le plus logique possible pour toutes personnes qui l'apprennent. Mais tant que des centaines de millions de personne parlerons comme langue maternelle l'Anglais, l'Espagnol ou le Français et que plus d'un milliard de personne connaitra uniquement le Chinois : je ne vois pas comment l'Esperanto peut percer réellement.
        • [^] # Re: Suis je le seul ?

          Posté par  . Évalué à 2.

          Juste pour la forme:

          "Je veux bien que GNU/Linux soit un système performant et robuste, et le meilleur du monde. Mais tant que des centaines de millions de personne utiliseront comme système d'exploitation MAC OS et que plus d'un milliard de personne connaîtra uniquement Windows : je ne vois pas comment GNU/Linux peut percer réellement."

          Sans contredire le fait que l'espéranto a peu (aucune?) de chances de percer, ton argumentaire, c'est un peu "tant que ça n'a pas percé, ça ne peut pas percer".

          Pour ce moteur de traduction, ça ne fait peut-être pas partie de ses priorités de gérer des paires de langues que l'on retrouve partout ailleurs.
        • [^] # Re: Suis je le seul ?

          Posté par  . Évalué à 4.

          Tu dis que l'anglais est une langue naturelle mais j'ai déjà vu une note de service dans une grande multinationnale à destination des anglophones de naissance pour leur expliquer que l'anglais parler par les non-anglophones (de naissance) n'est pas le même anglais que celui qu'ils connaisssent avec une listes des différences les plus évidentes pour qu'ils puissent plus facilement communiquer avec les autres.

          À partir de ce moment là, l'anglais parlé par les gens est plus une langue non-naturelle et je ne vois pas pourquoi l'esperanto ne pourrais pas prendre sa place.

          « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

        • [^] # Re: Suis je le seul ?

          Posté par  (site web personnel) . Évalué à 4.

          C'est sûr qu'avec des gens comme toi ça va pas percer des masses. Et pourtant si on fait le parallèle avec Linux.

          Mais tant que des centaines de millions de personnes utiliseront comme système d'exploitation installé par défaut sur leur ordinateur Windows XP, Windows Vista ou Mac OS X : je ne vois pas comment Linux pourra percer réellement.

          Est-ce le but de Linux de percer ? Non.
          Est-ce le but de l'Esperanto de remplacer les langues maternelles ? Non.

          Tu sais qu'en Hongrie il y a plus d'étudiants à apprendre l'Espéranto qu'à apprendre le Français ? Pourquoi ? Tout simplement parce qu'on a donné sa chance à l'Espéranto.

          Et puis toutes les langues sont une invention de l'Homme même si l'histoire nous le fait oublier. Et l'espéranto n'est pas né de nulle part mais prends ses racines dans des langues existantes. La roue n'a pas été réinventée mais améliorée dans le but de simplifier les communications entre peuples.

          L'association LinuxFr ne saurait être tenue responsable des propos légalement repréhensibles ou faisant allusion à l'évêque de Rome, au chef de l'Église catholique romaine ou au chef temporel de l'État du Vatican et se trouvant dans ce commentaire

          • [^] # Re: Suis je le seul ?

            Posté par  (site web personnel) . Évalué à 2.

            Mince grillai. Faut que je pense à lire l'enfilade de commentaires jusqu'au bout (Spécial dédicace aux amateurs de balados).

            L'association LinuxFr ne saurait être tenue responsable des propos légalement repréhensibles ou faisant allusion à l'évêque de Rome, au chef de l'Église catholique romaine ou au chef temporel de l'État du Vatican et se trouvant dans ce commentaire

    • [^] # Re: Suis je le seul ?

      Posté par  . Évalué à 3.

      C'est ptet tout simplement parce que les paire que tu évoques sont déjà traitées par une multitude de logiciel (pas forcement libre, certe), alors qu'il n'y a rien pour le Breton, le Galicien ni le Bokmål.

      Je ne suis pas un spécialiste du breton, mais en lisant la news j'ai été étonné car j'ai toujours entendu que même si ils se comprennent rapidement, les Bretons des 3 coins de la Bretagne parlent des versions assez différentes. Je suppose que le traducteur est fait pour le breton que ma voisine appelait le « Breton France 3 ».

      Ou alors je me trompe et il n'y a pas tant de différences ?
      • [^] # Re: Suis je le seul ?

        Posté par  . Évalué à 4.

        Testons avec une expression simple extraite d'un site en vannetais [1] :

        Mennadoù eh on é labourat àrnezhe
        Résultat : Motions *eh je suis *é travailler *àrnezhe

        La même en peurunvan : Mennadoù ez on o labourat warnezho
        Résultat : Motions je suis en train de travailler sur eux

        C'est déjà plus convainquant, même si Mennadoù signifie Projets dans ce contexte (on peut le déduire du verbe travailler).

        Apparemment, c'est donc un traducteur peurunvan → français. Ce n'est pas moi qui le leur reprocherai…

        [1] http://loig.cheveau.ifrance.com/
        On y trouvera aussi la thèse du monsieur sur le sujet APPROCHE PHONOLOGIQUE, MORPHOLOGIQUE ET SYNTAXIQUE DU BRETON DU GRAND LORIENT (BAS-VANNETAIS)
        • [^] # Re: Suis je le seul ?

          Posté par  . Évalué à 2.

          Le peurunvan est un standard orthographique du breton. Ainsi, il s'agit plutôt d'un traducteur breton-français qui prend en charge le peurunvan standard - dont l'usage est quasiment universel -.

          Pour ajouter la prise en charge d'autres standards (rendus désuets), skolveurieg, etrerannyezhel, etc, vos contributions seront les bienvenues.
      • [^] # Re: Suis je le seul ?

        Posté par  . Évalué à 2.

        Tel le français, le breton possède plusieurs dialectes, mais un seul standard à l'écrit. Certes, il y a eu plusieurs règles orthographiques concurrentes, mais celle utilisée dans le traducteur est adoptée par l'écrasante majorité des textes bretons publiés à nos jours.
    • [^] # Re: Suis je le seul ?

      Posté par  . Évalué à 2.

      Le nynorsk et le bokmål ne sont pas des dialectes mais deux standards d'écriture.
      Il y a une grande variété de dialectes de la langue norvégienne, mais le dialecte d'une personne ne détermine pas nécessairement le standard utilisé à l'écrit.
      • [^] # Re: Suis je le seul ?

        Posté par  . Évalué à 2.

        j'ose même pas imaginer ce que doit donner du Trøndersk en SMS...

        Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.