Sortie de la bêta d'Ubuntu 11.04

Posté par  (site web personnel) . Modéré par tuiu pol. Licence CC By‑SA.
9
3
avr.
2011
Ubuntu

Le 31 mars dernier est sortie la Bêta d'Ubuntu 11.04. Inutile de dire que beaucoup d'entre vous ont dû l'essayer. Le serveur HTTP était encore en peine ce samedi matin. Mais pour le lien torrent, pas de soucis ! Une petite machine virtuelle (1 coeur et 1024 Mo de RAM) et hop, voilà une découverte toute chaude !

Avancées de la reconnaissance vocale en 2011

Posté par  (site web personnel) . Modéré par baud123. Licence CC By‑SA.
42
27
mar.
2011
Audiovisuel

Voici un sujet qui fait parler de lui, un rêve de l'informatique qui s'approche à grand pas, voire qui est déjà présent dans bien des applications ! Vous avez certainement en tête le fameux « Via Voice » édité par IBM ou son successeur « Dragon naturally Speaking » édité par Scansoft. Les plus accros d'entre vous n'auront pas hésité à installer la reconnaissance vocale prévue par défaut dans XP, Vista ou Seven.

Mais lors du passage au libre, que nous effectuons pour la plupart pour des raisons différentes, avec des approches philosophiques, économiques ou pratiques, nous sommes confrontés à la perte de plusieurs des logiciels et/ou fonctionnalités que nous avions adoptés précédemment (compatibilité de notre écosystème logiciel). Pour ceux d'entre nous qui avaient fait le choix de la reconnaissance vocale, cette fonctionnalité reste difficilement remplaçable dans le monde de GNU/Linux. Les logiciels propriétaires cités précédemment ne sont pas prévus pour fonctionner sous nos distributions, et la communauté ne semble pas encore prête à offrir une alternative efficace. Il existe cependant quelques projets similaires dont l'avancement ne peut être négligé :

  • tout d'abord la source de données audio qui aide à la mise en place de ces projets : Voxforge collecte les données audio dans différentes langues pour permettre l'implémentation de l'utilisation de ces données par des moteurs de moteurs de reconnaissance vocale Open Source ;
  • CMUSphinx est le plus célèbre d'entre eux. Il permet – dans le cadre de la recherche principalement – d'obtenir la transcription écrite de données orales. D'un langage de programmation assez simple, basé sur des phonèmes, il permet d'obtenir des résultats prometteurs pour le développement d'applications libres selon les 3 règles chères aux plus stricts d'entre nous ;
  • un premier développement a été effectué il y a quelques années déjà pour la communauté française, avec Perlbox, qui permet de piloter son ordinateur en français, basé sur CMUsphinx 2 ;
  • une approche plus récente, toujours basée sur le projet CMUsphinx, est proposée par EvalDictator, mais pas encore disponible en français.

Alors vous me direz, quoi de neuf ? Et bien Google s'est aussi lancé dans la course à la reconnaissance vocale. Cela ne date pas d'hier :

CAElinux 2010 et Salome-meca 2010

Posté par  (site web personnel) . Modéré par patrick_g.
16
27
oct.
2010
Science
Avec quelques mois de retard (un ou deux pas plus), nous avons le plaisir de vous informer de la mise à jour d'un projet déjà paru ici il y a quelques années.