Forum Programmation.python Aide pour le réalisation d'un Script Python Comparer les biographies pour décider s'il s'agit du mêm

Posté par  . Licence CC By‑SA.
-10
5
mai
2015

J'ai un problème pour réaliser un script et j'aimerai si possible avoir un script en exemple pour le modifier après et y ajouter des choses.

Mon Scirpt porte sur "** Comparer les biographies pour décider s'il s'agit du même groupe/personne ou non ".**

Pouvez-vous me créer un script de base pour que je vois à quoi ça ressemble ? (Ps: Cours universitaire)

  • # voila

    Posté par  . Évalué à 7. Dernière modification le 05 mai 2015 à 19:24.

    Tu devrais pouvoir commencer sur cette base:

    return 'il est né en Mars, et a vécu sans balle'=='t as pas 100 balles et un Mars'
    • [^] # Re: voila

      Posté par  . Évalué à 1.

      C'est pour un cours universitaire ? tu veux bien m'aider

      • [^] # Re: voila

        Posté par  . Évalué à 10.

        de deux choses l'une:

        1/ tu es l'auteur du cours, et je ne vois pas ni pourquoi, ni comment, tu comptes enseigner un domaine que tu ne maitrises pas
        2/ tu suis ce cours en tant qu'étudiant, et je ne vois pas l'intérêt pour toi de demander à d'autres de faire tes devoirs

        dans tous les cas, ta demande ne pourrait pas être satisfaite en un commentaire vu l'ampleur du travail à fournir et l'ensemble des techniques informatiques et linguistiques à maitriser.

  • # compression ?

    Posté par  (site web personnel) . Évalué à 3.

    si il s'agit d'un soucis d'information, tu peux tenter de calculer l'entropie de Shannon… en comparant les tailles des fichiers zippés par exemple…

    Bon courage.

  • # Où en es-tu?

    Posté par  . Évalué à 1.

    Pourquoi ne pas nous poster déjà l'état de ton script pour que nous t'aidions à le corriger?

  • # Question

    Posté par  . Évalué à 2.

  • # Soyons moderne et créatif

    Posté par  . Évalué à 4.

    Tu utilises l'API de Siri pour lui balancer le début des deux parpaings, et tu compares le premier lien wikipedia qu'elle te renvoie dans les deux cas. Si c'est le même lien, tu en déduis que c'est le même groupe de personne. Si elle renvoie tout le temps un lien vers Douglas Adams, c'est que tu n'as pas bien géré le cache. Si elle te renvoie ce lien, c'est qu'on est vendredi et que cette grosse feignasse a envie de troller.

  • # Rapide

    Posté par  (site web personnel) . Évalué à 4.

    En version débutant, ça donnerais ça:

    res = input("Après comparaison, trouvez-vous que les deux biographies relèvent du même groupe/personne ?")
    print(res)

    Votez les 30 juin et 7 juillet, en connaissance de cause. http://www.pointal.net/VotesDeputesRN

  • # Utilises tes cours

    Posté par  . Évalué à 4.

    Sinon une approche naïve (et simple à faire) : tu peux foutre les mot commençant par une majuscule dans un dico, virer ceux qui font parti du dictionnaire des noms communs de la langue de la bio, et comparer les deux dicos. (nb commun / nb total)

    Si tous les noms propres se retrouvent dans les deux dicos, tu as de forte chance d'avoir affaire à la même personne ou quelqu'un de proche; ensuite faut faire quelques tests pour évaluer à partir de quand ça diffère.

    Tu peux aussi si les bio le permettent, de gérer une sorte de chronologie (ordre d'apparition des mots ou groupement par chapitre/partie), et de faire un diff, tu peux aussi choper des groupements de mots typiquement école, collège, étude ou université sont généralement proche d'un nom, et attribuer un poids plus fort à ces éléments; pareil pour né, et mort.

    Bien évidemment si tu as des cours sur le traitement du langage ou plus adapté qu'une approche naïve, utilises les :P

    Il ne faut pas décorner les boeufs avant d'avoir semé le vent

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.