Journal Pourquoi les services de recherche d'image par similarité sont défaillants dans leur fonctionnement même

Posté par  .
Étiquettes : aucune
0
13
juil.
2010
Cher journal, voici une réflexion qui me tarabuste depuis quelques jours.
Après avoir installé ce célèbre plugin de recherche d'images similaires, je me disais naïvement que je pourrais retrouver l'histoire d'origine de ce chat qui fait du jiujitsu (eh oui, the internet is made of cats), du gamin qui photobombe sa mère exorcist-style, de la nageuse alien ...
Que de déceptions quand à chaque fois je tombais sur les liens d'autres sites qui avaient repompé les mêmes images sans une bribe d'explication.
Le problème est que quand il y a les explications, il y a moins de chance que l'image soit soumise à la recherche.
Et c'est donc par dizaines que sont soumises les images non sourcées, et se retrouvent donc dans les résultats qui suivent.

Si ce service ne sert qu'a trouver une image de meilleur qualité pour la coller dans son skyblog, je trouve son intérêt très limité.

Et vous, est-ce que vous l'utilisez? Si oui dans quel but?
Avez-vous des idées pour remédier au problème de l'origine? (tri par date, utilisation des temps de cerveaux disponibles des utilisateurs, rachat par google images , faire l'effort d'une recherche texte en rapport avec l'image ... )

Vous avez 4 heures.
La meilleure réponse gagne un lot de 10 sacs poubelles (contenance 10 NN chacuns).
  • # y en a des qui...

    Posté par  . Évalué à 4.

    y en a qui utilisent la recherche d'image pour tricher à whatthemovie. Mais chuuutt
    • [^] # Re: y en a des qui...

      Posté par  (site web personnel) . Évalué à 5.

      On ne triche pas. Rien n'interdit cela dans le règlement du site.

      http://whatthemovie.com/page/legal : The use of external scripts/robots to enter solutions in the quiz is forbidden.

      Jamais le titre n'est rempli automatiquement donc on a le droit :)

      L'association LinuxFr ne saurait être tenue responsable des propos légalement repréhensibles ou faisant allusion à l'évêque de Rome, au chef de l'Église catholique romaine ou au chef temporel de l'État du Vatican et se trouvant dans ce commentaire

      • [^] # Re: y en a des qui...

        Posté par  (site web personnel) . Évalué à 1.

        Tout a fait.
        Je dirai même que c'est une grande aide pour se souvenir des films qu'on a vu.
        on pourrait comparer va a l'application sur smartphone qui permet de connaître le titre et l'interprète d'une chanson qui passe a la radio
  • # ce célèbre plugin de recherche d'images similaires

    Posté par  . Évalué à 10.

    >>>ce célèbre plugin de recherche d'images similaires

    célèbre, non. de quoi tu causes ?
  • # utile dans quelques cas..

    Posté par  . Évalué à 8.

    pour ceux utilisent un même avatar avec des pseudo différents, cela permet de retrouver les différents compte d'une personne. Déjà rien que ca s'est flippant.

    cela permet aussi de voir, quand on achète une image pour l'utiliser dans un site commercial, si celle ci est utilisée. Grâce a tineye, on s'est aperçu qu'une image qu'on voulait utiliser avait déjà été utilisée dans un bouquin. Ça évite de faire des erreurs bêtes..

    Enfin, oui, ca permet de trouver une image en plus haute résolution. mais pour un graphiste, c'est important. Surtout quand le client a vu une image qui lui plait, et que ca permet d'éviter d'avoir a écumer les banques d'image.
  • # Recherche de violation de copyright ?

    Posté par  (Mastodon) . Évalué à 9.

    Je ne connaissais pas cet outil. C'est assez amusant en effet.

    Une utilité peut-etre une recherche de violation de copyright, pour un photographe par exemple.

    En théorie, la théorie et la pratique c'est pareil. En pratique c'est pas vrai.

  • # Contenance de 10 NN

    Posté par  . Évalué à 7.

    Non pas que je sois intéressé par le gain de 10 sacs poubelles, puis c'est déjà trop tard sauf si il y a une prolongation, qu'est-ce que cette unité de NN ?

    The capacity of the human mind for swallowing nonsense and spewing it forth in violent and repressive action has never yet been plumbed. -- Robert A. Heinlein

    • [^] # Re: Contenance de 10 NN

      Posté par  . Évalué à 10.

      Non pas que je sois intéressé par le gain de 10 sacs poubelles, puis c'est déjà trop tard sauf si il y a une prolongation, qu'est-ce que cette unité de NN ?

      Le Nouveau-Né ?
      • [^] # Re: Contenance de 10 NN

        Posté par  . Évalué à 5.

        Ça fait combien de congélateurs ?

        Article Quarante-Deux : Toute personne dépassant un kilomètre de haut doit quitter le Tribunal. -- Le Roi de Cœur

        • [^] # Re: Contenance de 10 NN

          Posté par  (site web personnel) . Évalué à 1.

          D'après Wikipedia¹, un NN fait 0.5 congélateur.

          ¹ Véronique_Courjault
        • [^] # Re: Contenance de 10 NN

          Posté par  . Évalué à -1.

          Sachant qu'un congélateur fait en moyenne 150 litres, qu'un Nouveau-Né est environ égal à 2 litres, je dirais un peu plus d'un congélateur.
          Pour ceux qui préfèrent les cheminées, ça fait environ 0,2 stères.
          • [^] # Re: Contenance de 10 NN

            Posté par  . Évalué à 3.

            Toi, t'as pas eu d'enfants :)

            Un nouveau né moyen pèse 3 à 4 kg (en comptant large) et est composé de chair humaine, et donc a environ la même densité que l'humain moyen. Soit, en gros, 1. Ce qui nous donne environ 3 à 4 litres comme volume (vous avez suivi pour la division ?)

            Mais comme le volume n'est pas l'encombrement (demande au sable sec) on peut estimer environ à 4 à 6 litres le besoin d'espace. Comment ? A la rache.

            Je te laisse faire la division avec le congélateur moyen.
  • # Photo

    Posté par  (site web personnel) . Évalué à 9.

    Pour moi, c'est un outil extrêmement utile : étant photographe, ça me permet de retrouver tous ceux qui ont illicitement copié mes photos, et de réclamer au moins un crédit (ou, si c'est un usage commercial, des sous).
  • # quel est le problème ?

    Posté par  (site web personnel) . Évalué à 3.

    Je ne comprends pas ton problème. Tu recherches l'origine d'une image ? Quel est le rapport avec la similarité ?

    Les services de similarité utilisent un ensemble de points descripteurs calculés à partir de l'image (typiquement points SIFT ou SURF). Ces points dits 'invariants' peuvent être retrouvés dans des bases de données construites à cet effet.

    La recherche par similarité sort un ensemble d'image, par ordre de similarité décroissant avec l'image soumise. La similarité elle-même est une distance calculée à partir du nombre de points descripteurs en commun.

    Alors évidemment, puisque le réseau est un outil de copie avant tout, les X premiers résultats vont être des images identiques à celle soumise. Normalement un moteur devrait les aggréger, pour plus de clareté.

    Quand à l'image 'originale', ce n'est pas par similarité que tu vas la découvrir...
  • # metadata

    Posté par  . Évalué à 2.

    La linguistique est et restera irremplacable. La recherche d'une image par une autre est absolument inutile.

    Ce qu'il faut, c'est étendre les algorithmes de reconnaissance de forme, d'objet, de visage, d'animaux, etc, pour tagger automatiquement les images.

    Aujourd'hui, les visages commencent à être détecté automatiquement, ce qui fait que tu peux trouver facilement toutes les photo avec "Robert" en faisant une simple recherche par mot clé, avec picasa ou iphoto (facebook va s'y mettre).
    Demain les images auront les tags les plus usuels directement associé (chat + lunette de soleil + guitare par exemple).
    Pour l'instant je le fais (dans le cadre professionnel) manuellement, et c'est chiantissime.

    A noter qu'une grosse part de l'innovation dans ce domaine viens du football, et oui pour avoir le coup de boule de zidanne les opérateurs tagges manuellement les mini clip vidéo à la volé lors des matches, et le tout tend à être de plus en plus automatisé...
    • [^] # Re: metadata

      Posté par  . Évalué à 3.

      noter qu'une grosse part de l'innovation dans ce domaine viens du football, et oui pour avoir le coup de boule de zidanne

      Je pense que le coup de pied volant de "De Jong" lors de la dernière finale va lui voler la vedette.
      • [^] # Re: metadata

        Posté par  . Évalué à 3.

        C'est plus beau et mieux filmé, mais moins volontaire.

        Envoyé depuis mon lapin.

        • [^] # Re: metadata

          Posté par  . Évalué à 1.

          > [...] moins volontaire.

          Tu penses qu'il visait la tête ?
          Maintenant Zidane doit se sentir bien ridicule ! Il aurait fait son coup de boule au début du match, on ne lui aurait rien dit.

          C'est un meilleur style que Cantona (qui était bien brouillon dans le genre). Mais si ne n'est pas en finale de la coupe du monde, ça perd de son charme.

          À la prochaine finale, je me demande qu'elle sera la nouveauté : après le coup de boule puis le coup de pied dans le thorax, il faudra trouver un truc plus violent.
          • [^] # Re: metadata

            Posté par  . Évalué à 3.

            Y'aura plus de coupe du monde de foot ! Ça va être remplacé par du Calcio florentin à la demande des joueurs et de l'encadrement.
    • [^] # Re: metadata

      Posté par  (site web personnel) . Évalué à 1.

      "La linguistique est et restera irremplacable. La recherche d'une image par une autre est absolument inutile."

      Ceci est faux. Quand nous cherchons quelqu'un ou quelque chose dans notre champs de vision, nous ne cherchons pas par tag mais bien par similarité d'image (vive le cortex).

      Ce que fait le cerveaux humain peut être copié par les machines, il y a déjà bien des travaux là-dessus.
      • [^] # Re: metadata

        Posté par  . Évalué à 2.

        et tu intéragi comment? Moi je suis très très nul en dessin, donc je ne peux pas dessiner un chat pour dire à l'ordi que je cherche un chat assis.

        Je préfère dire "chat + assis".
    • [^] # Re: metadata

      Posté par  . Évalué à 2.

      Le taggage automatique serait intéressant dans un certain nombre de cas (collection personnelle notamment). Mais j'ai bien peur qu'il manque trop de sémantique à la reconnaissance pour faire la recherche efficace d'une photo précise sur le net: il va falloir attendre longtemps encore pour que soit taggé automatiquement les mots "photobombing", "tronche mi-humaine mi-alien", ... ).
  • # Recherche par esquisse

    Posté par  . Évalué à 4.

    Salut

    C'est marrant ce service (tineye) mais en fait ce que je trouverais vraiment utile c'est de pouvoir retrouver une image a partir d'une esquisse de cette image.

    Il y a moultes années en bossant sur du traitement d'image, j'avais vu le principe d'une recherche par esquisse. En gros tu dessinais grossièrement une image (c'etait tres adapté a un tableau peint) et tu lancais la recherche. Il te trouvait les images similaires.
    Le mécanisme sous-jacent était une comparaison de signatures d'images, calculées avec des ondelettes multi-niveaux (si ma mémoire est pas trop défaillante).

    J'aimerais tellement qu'un tel truc existe a grande echelle!
    (le pb principal etant surement qu'il faut une immense base de signatures d'images, donc une grosse infra, donc plein de pépettes).

    Voila c'est un peu HS mais c'est mon avis à moi que je respecte.
  • # Autour du sujet...

    Posté par  . Évalué à 1.

    Si vraiment le chat karatéka, le fonctionnement des aimants ou un de leurs compères te tourmentent, ce site pourra t'aider [PNSFW] http://knowyourmeme.com/

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.