Journal Filtre bayésien pour une expérience..

Posté par  (site web personnel, Mastodon) .
Étiquettes : aucune
0
1
juin
2005
Hello,

Je cherche à faire une classification binaire sur un jeu de donnée. Pour l'expérience, je cherchais à tenter une classification bayésienne, ça m'amuse.

Seulement, contrairement à une analyse bayésienne type spam/anti-spam, ici l'ordre à une importance.

En fait, chaque donnée est de type :

Colonne1=B14, Colonne2=A16, Colonne3=B48, etc...

Evidemment, un B14 dans la colonne 1 n'a pas du tout la même signification qu'un B14 dans une autre colonne.

Je me demandais si vous aviez une idée pour appliquer un filtre bayésien à ce problème.

Je viens de regarder Reverend ( http://sourceforge.net/projects/reverend/(...) ), ça a l'air pas mal, mais je ne vois pas bien comment en fait l'adapter à mon problème.

Je précise que c'est vraiment une lubbie de ma part et j'aimerais vraiment essayer Bayes là dessus !
  • # Fonction de poids

    Posté par  . Évalué à 2.

    Je pense qu'il faut que tu crees une fonction de poids qui tienne compte du fait que tu veuilles preferentiellement que les B14 aillent dans la colonne1, les A16 dans la colonne machin et ainsi de suite.

    Il faut donc faire un histogramme pour chaque B14, A16,... qui donne le poids pour chaque colonne (ou l'inverse, ca depend bien sur de tes donnees en entree, ou alors un truc a 2 entrees).

    Ce sera donc la fonction de poids qui modelisera la fonction discriminante de ton filtre bayesien...
    (Bon ensuite faut voir les details :)
    • [^] # Re: Fonction de poids

      Posté par  (site web personnel, Mastodon) . Évalué à 2.

      Je me suis mal exprimé : un B14 dans la colonne 1 ou 2 n'a pas du tout le même sens !

      Par exemple : la colonne 1 est la couleur de la voiture et B14 représente la couleur "rouge".
      La colonne2 est la marque de la voiture et B14 représente "Honda".

      Mes livres CC By-SA : https://ploum.net/livres.html

      • [^] # Re: Fonction de poids

        Posté par  (site web personnel) . Évalué à 3.

        tu pourrais commencer à utiliser des codes qui veulent dire quelquechose ? non ? a moins que les filtres B. t'en empêchent ?
      • [^] # Re: Fonction de poids

        Posté par  . Évalué à 2.

        Ok...
        Donc comment veux-tu les classer ? Quel est le(s) critere(s) ?

        Lapin compris...
        • [^] # Re: Fonction de poids

          Posté par  (site web personnel, Mastodon) . Évalué à 2.

          J'ai une colonne binaire (1 ou 2) sur un training set. Je n'ai évidemment plus cette colonne sur le testing set !

          C'est ça le principe du filtrage bayésien : je ne veux pas donner de sens aux informations !

          Mes livres CC By-SA : https://ploum.net/livres.html

      • [^] # Re: Fonction de poids

        Posté par  (site web personnel) . Évalué à 3.

        Je bosse sur les filtres bayésiens en ce moment et je n'arrive pas à cerner suffisament ton problème pour savoir précisément comment tu comptes les utiliser. Tu as quoi comme jeu de données pour l'apprentissage ? et pour l'application ?
        Pourquoi ne pas simplement traiter une donnée Colonne1=B14 par un code obtenu par concaténation, par exemple : B14#1 ? Mais encore une fois, ton objectif reste assez flou...
        • [^] # Re: Fonction de poids

          Posté par  (site web personnel, Mastodon) . Évalué à 2.

          Ton idée est pas mal

          Voilà, je te présente une donnée du training test :

          A12,48,A32,A43,59510,A61,A73,2,A92,A101,2,A121,22,A143,A152,1,A173,1,A191,A201,-4,0,2

          En fait, tout cela a une signification précise, mais ici on s'en fout, toutes les données sont fournies comme ça.

          La dernière valeur est soit un un, soit un 2 : c'est celle là qu'il faut essayer de prédire.

          Les valeurs commençant par A sont des valeurs qualitatives, les autres sont numériques.
          Je comptais laisser tomber les valeurs numériques en fait.

          Mes livres CC By-SA : https://ploum.net/livres.html

          • [^] # Re: Fonction de poids

            Posté par  (site web personnel, Mastodon) . Évalué à 2.

            Pour info, j'ai fait comme tu as dit, et ça marche relativement pas mal, je suis agréablement surpris :-)

            (ah oui, finalement j'ai utilise ifile, que je gère via des scripts bash)

            Mes livres CC By-SA : https://ploum.net/livres.html

  • # Réseaux Neuronaux

    Posté par  . Évalué à 2.

    Bien que les filtres bayésiens soient à la mode, ton problème ressemble bougrement à ce que savent traiter les réseaux neuronaux... en particulier, la notion de vecteur d'entrée...

    Et en plus, tu peux également faire de l'auto-apprentissage avec eux... Je m'orienterai vers ça à ta place.
    • [^] # Re: Réseaux Neuronaux

      Posté par  (site web personnel, Mastodon) . Évalué à 3.

      ouaip, tout à fait d'accord. Mais ça c'est déjà fait..

      J'aimerais justement essayer ma petite popote en bayésien pour le fun ;-)

      Mes livres CC By-SA : https://ploum.net/livres.html

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.