Il est toujours possible de normaliser les chaines avant, puis de faire un calcul de distance de levenshtein. Ici la question demandait juste une recherche de mots "similaires" : effectivement il faut peut-être affiner la définition de "similaire".
Mais comme en exemple il y a "Beethoven - Concerto n°1.mp3" et "Beethoven - Concerto no.1 en la mineur.mp3", je pense que la définition est encore plus large qu'une simple distinction phonétique.
Et donc pour répondre à la question, je ne connais pas d'outil tout fait. Par contre il existe en Perl des modules pour calculer cette distance.
Il suffit d'enrober tout ça. Par ex pour avoir la liste des noms de fichiers qui ont la distance la plus courte :
/usr/bin/perl
use strict;
use Text::Levenshtein qw/distance/;
use List::Util qw/min/;
my $f = shift or die "missing filename\n";
opendir my $dir , '.';
my @files = readdir $dir;
closedir $dir;
my %d;
push @{$d{distance($f, $_)}}, $_ foreach @files;
print map { "$_\n" } @{$d{min keys %d}};
Par exemple entre Attila.doc et Atila.doc, la distance est de 1
entre "mon projet.pdf" ou "projet.pdf", la distance est 4.
Donc en calculant toutes les distances, et en fixant un seuil il est possible d'avoir un liste de nom probablement proches. Par contre ça ne marche pas à tous les coups :
"Beethoven - Concerto n°1.mp3" et "Beethoven - Concerto no.1 en la mineur.mp3" => ~15 (à la louche).
Essaye peut-être en divisant la distance par la longueur de la chaine, mais bon est-ce que 15/44 = 36% signifie que les chaines sont proches ou pas ? si on augmente le seuil, on risque d'avoir de faux positifs...
Peut-être qu'en pondérant différement les ajouts dans le calcul de la distance, on peut avoir qqe chose de plus efficace pour ces cas.
Je confirme. En désactivant la toolbar, le scroll redevient fluide.
À une époque j'avais même des morceaux de la toolbar (en fait la partie supérieure qui dépasse quand elle est minimisée) qui restaient sur la page, et qui me barraient la page tous les 20 pixels environ (le pas du scroll). Il suffisait d'iconifier puis de reagrandir la fenetre pour provoquer un redraw et tout récupérer...
Est-ce que le phénomène se produit avec la main devant la sortie de la télécommande ?
si oui => c'est pas par l'infrarouge que ça passe
si non => c'est l'infrarouge qui perturbe le PC => il doit y avoir un récepteur qqe part.
Pour trouver le récepteur, tu peux essayer de filmer ton PC avec un camescope, souvent ils permettent de voir à travers les caches des capteurs IR. Essayer sur un lecteur de DVD, ou une freebox, c'est assez marrant de voir l'interieur à travers l'afficheur.
Oui, désolé pour le lapsus. Et donc comment continuer à vendre des OLPC dans quelques mois alors que l'OS ne sera plus dispo ? ou alors les membres de l'OLPC ont des infos sur la politique future de Microsoft que je ne connais pas (cas le plus probable)
Passer sous XP alors que le fournisseur a annoncé la fin de la maintenance, faut vraiment avoir les neurones qui se touchent... Même si une pétition est en cours, c'est quand même un sacré coup de poker.
Désolé, pas d'avis ou de conseil, juste des interrogations...
Je suis également très tenté de switcher, mais je passe beaucoup de temps à coder sous emacs, et j'ai développé - comme beaucoup d'emacsien - des tas d'automatisme, à tel point que je ne sais plus sur certaines séquences s'il faut garder control enfoncé ou non ( Il faut que je le fasse au ralenti pour vérifier).
Bref, vous voyez ma question, ça donne quoi l'apprentissage des raccourcis d'emacs sur un clavier bépo ?
De plus je suppose que les fréquences des lettres utilisés quand on programme n'est pas la même que quand on rédige du français ou de l'anglais. Est-ce qu'au final un bépo est vraiment mieux pour coder ?
Par exemple sur un qwerty, les [] {} et () sont toujours sur 2 touches adjacentes et accessibles en direct ou via MAJ. Sur un azerty, c'est déjà moins bien (ALT+GR et touches éloignées). Idem pour \, /, $, %, @ (trés utilisés en perl, moins dans d'autres langages...)
Bref, existe-t-il des répartition à la dvorak pour développeur ? Peut-être qu'un dvorak US serait mieux adapté dans mon cas...
C'est marrant quand même cette mauvaise foi. En résumé : "IIS est devant Apache parce qu'il est techniquement meilleur, pas pour des raisons de lobying. Par contre, MSN derrière Yahoo ça compte pas, MSN est quand même techniquement meilleur, c'est juste un problème de com."
Si tu regardes ce que MS fait : Visual Studio, SQL Server, Exchange, Office, Windows, XBox, MSN Messenger, .Net, ... tous ces produits sont parmis les meilleurs de leur categorie, j'ai du mal a appeler ca "tirer vers le bas".
Youhouhou, j'en peux plus, arrête ! J'ai trop mal au côtes...
Et l'autre truc marrant, c'est cette incapacite a admettre que certains produits ms sont effectivement tres bons.
Ça dépend pour qui, c'était le sujet. En prenant fortement partie, je ne faisais que remarquer qu'il est facile de prendre un chiffre dans une étude pour faire avancer sa cause (50% des plus grosses boites utilisent du ms), en omettant de parler d'autres chiffres tout aussi interressants (70% des boites qui font du web n'utilisent pas ms).
De toute façon ce ne sont que des chiffres, parlons plutôt des facilités de maintenance, (c'est toujours d'actualités les reboot pour les maj sous windows ?), des failles, des perfs, des interactions entre le serveur et les applis (mod-php, mod-perl, fastcgi, etc...), et autres fonctionalités (reverse-proxy, authent,...)
Tout a fait, et mon petit doigt me dit que quand tu sers la majorite des sites des plus grosses societes US (cf. http://www.search-this.com/2007/06/27/microsoft-iis-vs-apach(...) ) tu dois pas etre si mal niveau perfs et maintenance. Il n'y a aucune dependance vis-a-vis de Windows pour le web qui les force a utiliser IIS/Windows, si ils le font c'est qu'ils le trouvent aussi bon voir meilleur que ses concurrents globalement.
C'est marrant, il suffit de scroller un peu sur l'article pour s'apercevoir que pour le top 20 des "web-based companies", c'est l'inverse, c'est 50% pour Apache. De là à dire que pour les gens du métier, Apache est bien meilleur que IIS, il n'y a qu'un pas que je franchi allègrement !
Le pendant étant que les grosses boites dont le coeur de métier n'a rien à voir avec le web choisissent IIS par simple effet moutonnier...
Ben, non, c'est logique, c'est les seules qui peuvent payer les licenses et tous les couts cachés de ce genre de solution.
<mode caricature="on>C'est sûr qu'installer un serveur libre, le configurer correctement, et faire faire apt-get update/upgrade de temps en temps à un stagiaire, c'est pas le même budget...
[^] # Re: Calcul de distance
Posté par jigso . En réponse au message Trouver des fichiers à nom similaires. Évalué à 1.
Mais comme en exemple il y a "Beethoven - Concerto n°1.mp3" et "Beethoven - Concerto no.1 en la mineur.mp3", je pense que la définition est encore plus large qu'une simple distinction phonétique.
[^] # Re: Calcul de distance
Posté par jigso . En réponse au message Trouver des fichiers à nom similaires. Évalué à 4.
Il suffit d'enrober tout ça. Par ex pour avoir la liste des noms de fichiers qui ont la distance la plus courte :
/usr/bin/perl
use strict;
use Text::Levenshtein qw/distance/;
use List::Util qw/min/;
my $f = shift or die "missing filename\n";
opendir my $dir , '.';
my @files = readdir $dir;
closedir $dir;
my %d;
push @{$d{distance($f, $_)}}, $_ foreach @files;
print map { "$_\n" } @{$d{min keys %d}};
# Calcul de distance
Posté par jigso . En réponse au message Trouver des fichiers à nom similaires. Évalué à 5.
Par exemple entre Attila.doc et Atila.doc, la distance est de 1
entre "mon projet.pdf" ou "projet.pdf", la distance est 4.
Donc en calculant toutes les distances, et en fixant un seuil il est possible d'avoir un liste de nom probablement proches. Par contre ça ne marche pas à tous les coups :
"Beethoven - Concerto n°1.mp3" et "Beethoven - Concerto no.1 en la mineur.mp3" => ~15 (à la louche).
Essaye peut-être en divisant la distance par la longueur de la chaine, mais bon est-ce que 15/44 = 36% signifie que les chaines sont proches ou pas ? si on augmente le seuil, on risque d'avoir de faux positifs...
Peut-être qu'en pondérant différement les ajouts dans le calcul de la distance, on peut avoir qqe chose de plus efficace pour ces cas.
[^] # Re: Lien
Posté par jigso . En réponse au journal Les .eu gratuits !. Évalué à 2.
www.adi.eu
www.bl.eu
www.cessez.le.f.eu
[^] # Re: bugs
Posté par jigso . En réponse au journal Scroller quand t'es loggué. Évalué à 1.
[^] # Re: Idem
Posté par jigso . En réponse au journal Scroller quand t'es loggué. Évalué à 4.
À une époque j'avais même des morceaux de la toolbar (en fait la partie supérieure qui dépasse quand elle est minimisée) qui restaient sur la page, et qui me barraient la page tous les 20 pixels environ (le pas du scroll). Il suffisait d'iconifier puis de reagrandir la fenetre pour provoquer un redraw et tout récupérer...
[^] # Re: Il y avait plus court...
Posté par jigso . En réponse au message Supprimer liste de fichier en bash. Évalué à 0.
[^] # Re: Il y avait plus court...
Posté par jigso . En réponse au message Supprimer liste de fichier en bash. Évalué à 0.
xargs -a a_supp.lst -d \n rm
# Il y avait plus court...
Posté par jigso . En réponse au message Supprimer liste de fichier en bash. Évalué à 6.
xargs -a a_supp.lst rm
# test
Posté par jigso . En réponse au message Ma télécommande a pris pocession de mon clavier. Évalué à 3.
si oui => c'est pas par l'infrarouge que ça passe
si non => c'est l'infrarouge qui perturbe le PC => il doit y avoir un récepteur qqe part.
Pour trouver le récepteur, tu peux essayer de filmer ton PC avec un camescope, souvent ils permettent de voir à travers les caches des capteurs IR. Essayer sur un lecteur de DVD, ou une freebox, c'est assez marrant de voir l'interieur à travers l'afficheur.
[^] # Re: <mode desabusé=on>
Posté par jigso . En réponse au journal Le projet OLPC va virer Linux pour ne tourner que sous Windows.. Évalué à 2.
# <mode desabusé=on>
Posté par jigso . En réponse au journal Le projet OLPC va virer Linux pour ne tourner que sous Windows.. Évalué à 8.
# Au cas où...
Posté par jigso . En réponse au message Configuration du clavier.... Évalué à 1.
Avec xkeycaps, est-ce que la touche passe en jaune quand tu appuies dessus ?
[^] # Re: explication
Posté par jigso . En réponse au journal Linus Torvalds: youtube no workee - fedora 9 not usable for wife. Évalué à 1.
# Mon pc est orphelin...
Posté par jigso . En réponse au journal 2008 L'Odyssée de Arthur C. Clarke. Évalué à 7.
$ hostname
hal
# oui mais...
Posté par jigso . En réponse au journal La quête du clavier parfait en 10 points. Évalué à 3.
Je suis également très tenté de switcher, mais je passe beaucoup de temps à coder sous emacs, et j'ai développé - comme beaucoup d'emacsien - des tas d'automatisme, à tel point que je ne sais plus sur certaines séquences s'il faut garder control enfoncé ou non ( Il faut que je le fasse au ralenti pour vérifier).
Bref, vous voyez ma question, ça donne quoi l'apprentissage des raccourcis d'emacs sur un clavier bépo ?
De plus je suppose que les fréquences des lettres utilisés quand on programme n'est pas la même que quand on rédige du français ou de l'anglais. Est-ce qu'au final un bépo est vraiment mieux pour coder ?
Par exemple sur un qwerty, les [] {} et () sont toujours sur 2 touches adjacentes et accessibles en direct ou via MAJ. Sur un azerty, c'est déjà moins bien (ALT+GR et touches éloignées). Idem pour \, /, $, %, @ (trés utilisés en perl, moins dans d'autres langages...)
Bref, existe-t-il des répartition à la dvorak pour développeur ? Peut-être qu'un dvorak US serait mieux adapté dans mon cas...
[^] # Re: Peut-être
Posté par jigso . En réponse au message Comment trouver de bons développeurs web. Évalué à 0.
[^] # ³
Posté par jigso . En réponse au journal Hahaha. Évalué à -5.
# ¹
Posté par jigso . En réponse au journal Hahaha. Évalué à -5.
[^] # Re: x2x
Posté par jigso . En réponse au message Équivalent synergy. Évalué à 1.
puis (de mémoire) :
tar zxf data.tar.gz
[^] # Re: Mais ...
Posté par jigso . En réponse au journal Microsoft offre 30 milliards d'euros pour acheter yahoo. Évalué à 3.
Si tu regardes ce que MS fait : Visual Studio, SQL Server, Exchange, Office, Windows, XBox, MSN Messenger, .Net, ... tous ces produits sont parmis les meilleurs de leur categorie, j'ai du mal a appeler ca "tirer vers le bas".
Youhouhou, j'en peux plus, arrête ! J'ai trop mal au côtes...
[^] # Re: Euh
Posté par jigso . En réponse au journal Microsoft offre 30 milliards d'euros pour acheter yahoo. Évalué à 1.
Ça dépend pour qui, c'était le sujet. En prenant fortement partie, je ne faisais que remarquer qu'il est facile de prendre un chiffre dans une étude pour faire avancer sa cause (50% des plus grosses boites utilisent du ms), en omettant de parler d'autres chiffres tout aussi interressants (70% des boites qui font du web n'utilisent pas ms).
De toute façon ce ne sont que des chiffres, parlons plutôt des facilités de maintenance, (c'est toujours d'actualités les reboot pour les maj sous windows ?), des failles, des perfs, des interactions entre le serveur et les applis (mod-php, mod-perl, fastcgi, etc...), et autres fonctionalités (reverse-proxy, authent,...)
[^] # Re: Euh
Posté par jigso . En réponse au journal Microsoft offre 30 milliards d'euros pour acheter yahoo. Évalué à 4.
C'est marrant, il suffit de scroller un peu sur l'article pour s'apercevoir que pour le top 20 des "web-based companies", c'est l'inverse, c'est 50% pour Apache. De là à dire que pour les gens du métier, Apache est bien meilleur que IIS, il n'y a qu'un pas que je franchi allègrement !
Le pendant étant que les grosses boites dont le coeur de métier n'a rien à voir avec le web choisissent IIS par simple effet moutonnier...
[^] # Re: Euh
Posté par jigso . En réponse au journal Microsoft offre 30 milliards d'euros pour acheter yahoo. Évalué à 2.
Ben, non, c'est logique, c'est les seules qui peuvent payer les licenses et tous les couts cachés de ce genre de solution.
<mode caricature="on>C'est sûr qu'installer un serveur libre, le configurer correctement, et faire faire apt-get update/upgrade de temps en temps à un stagiaire, c'est pas le même budget...
[^] # Re: rapport en téléchargement
Posté par jigso . En réponse au journal [presque HS] Le rapport Attali « propriété » de l'éditeur Bernard Fixot !. Évalué à 3.
Je crois qu'on est tous d'accord !