Hello,
Je cherche à faire une classification binaire sur un jeu de donnée. Pour l'expérience, je cherchais à tenter une classification bayésienne, ça m'amuse.
Seulement, contrairement à une analyse bayésienne type spam/anti-spam, ici l'ordre à une importance.
En fait, chaque donnée est de type :
Colonne1=B14, Colonne2=A16, Colonne3=B48, etc...
Evidemment, un B14 dans la colonne 1 n'a pas du tout la même signification qu'un B14 dans une autre colonne.
Je me demandais si vous aviez une idée pour appliquer un filtre bayésien à ce problème.
Je viens de regarder Reverend ( http://sourceforge.net/projects/reverend/(...) ), ça a l'air pas mal, mais je ne vois pas bien comment en fait l'adapter à mon problème.
Je précise que c'est vraiment une lubbie de ma part et j'aimerais vraiment essayer Bayes là dessus !
# Fonction de poids
Posté par Sebastien . Évalué à 2.
Il faut donc faire un histogramme pour chaque B14, A16,... qui donne le poids pour chaque colonne (ou l'inverse, ca depend bien sur de tes donnees en entree, ou alors un truc a 2 entrees).
Ce sera donc la fonction de poids qui modelisera la fonction discriminante de ton filtre bayesien...
(Bon ensuite faut voir les details :)
[^] # Re: Fonction de poids
Posté par ploum (site web personnel, Mastodon) . Évalué à 2.
Par exemple : la colonne 1 est la couleur de la voiture et B14 représente la couleur "rouge".
La colonne2 est la marque de la voiture et B14 représente "Honda".
Mes livres CC By-SA : https://ploum.net/livres.html
[^] # Re: Fonction de poids
Posté par john Smith (site web personnel) . Évalué à 3.
[^] # Re: Fonction de poids
Posté par Sebastien . Évalué à 2.
Donc comment veux-tu les classer ? Quel est le(s) critere(s) ?
Lapin compris...
[^] # Re: Fonction de poids
Posté par ploum (site web personnel, Mastodon) . Évalué à 2.
C'est ça le principe du filtrage bayésien : je ne veux pas donner de sens aux informations !
Mes livres CC By-SA : https://ploum.net/livres.html
[^] # Re: Fonction de poids
Posté par MrLapinot (site web personnel) . Évalué à 3.
Pourquoi ne pas simplement traiter une donnée Colonne1=B14 par un code obtenu par concaténation, par exemple : B14#1 ? Mais encore une fois, ton objectif reste assez flou...
[^] # Re: Fonction de poids
Posté par ploum (site web personnel, Mastodon) . Évalué à 2.
Voilà, je te présente une donnée du training test :
A12,48,A32,A43,59510,A61,A73,2,A92,A101,2,A121,22,A143,A152,1,A173,1,A191,A201,-4,0,2
En fait, tout cela a une signification précise, mais ici on s'en fout, toutes les données sont fournies comme ça.
La dernière valeur est soit un un, soit un 2 : c'est celle là qu'il faut essayer de prédire.
Les valeurs commençant par A sont des valeurs qualitatives, les autres sont numériques.
Je comptais laisser tomber les valeurs numériques en fait.
Mes livres CC By-SA : https://ploum.net/livres.html
[^] # Re: Fonction de poids
Posté par ploum (site web personnel, Mastodon) . Évalué à 2.
(ah oui, finalement j'ai utilise ifile, que je gère via des scripts bash)
Mes livres CC By-SA : https://ploum.net/livres.html
[^] # Re: Fonction de poids
Posté par MrLapinot (site web personnel) . Évalué à 2.
# Réseaux Neuronaux
Posté par mac . Évalué à 2.
Et en plus, tu peux également faire de l'auto-apprentissage avec eux... Je m'orienterai vers ça à ta place.
[^] # Re: Réseaux Neuronaux
Posté par ploum (site web personnel, Mastodon) . Évalué à 3.
J'aimerais justement essayer ma petite popote en bayésien pour le fun ;-)
Mes livres CC By-SA : https://ploum.net/livres.html
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.