Bonjour,
Connaissez-vous des logiciels libre de détection de plagiat ? Actuellement nous utilisons un logiciel propriétaire et voulons étudier d'autres voies.
Pour l'histoire, je ne suis pas personnellement impliqué dans le groupe plagiat de notre institution, mais relativement proche des personnes qui s'en occupent. Je serais particulièrement heureux de pouvoir leur proposer une solution open-source, qui vas dans le sens de ce qu'on impose aux scientifiques qui font appel à nous ( on ne finance que des articles open-access et on pousse pour l'open-data ).
La grosse difficulté est qu'il faut avoir accès à une grande base de donnée d'articles scientifiques et assurer une confidentialité des données traitées. Une particularité Suisse à remplir est d'être efficace non seulement pour des documents en anglais, mais aussi en français, en allemand et en italien (je crois pas que le romanche ait été utilisé).
Si vous avez des pistes, je suis preneur.
Merci à tous.
# liberté
Posté par ckiller . Évalué à -3.
Ce que vous appelez plagiat est de la diffusion d'information.
[^] # Re: liberté
Posté par hitmanu . Évalué à 0.
C'est l'utilisation d'information/d’œuvre dans sont intégralité ou pas sans aucune modification pour son propre compte sans cité ses sources.
Merci aux personnes qui mon aidé a trouvé des solutions pour essayer d’écrire sans faute d’orthographe.
[^] # Re: liberté
Posté par roduit (site web personnel) . Évalué à 3.
Comme dit plus haut, on fait du plagiat quand on écrit un texte sans citer ses sources.
Par exemple, quand tu fait une thèse ou un mémoire et tu récupère des information de différentes source. Si tu cite clairement ta/tes source/s, il n'y a pas de problème. Cependant, si tu omet d'écrire d'où viens ton idée, on considère ça comme du plagiat car tu te l'approprie.
C'est très important de pouvoir détecter et quantifier le plagiat pour trier les chercheurs qui font de la recherche original de ceux qui s'approprient l'originalité des sources. Je dis quantifier, car il existe toujours la possibilité d'oublier de citer une source tout en étant honnête. Mais passé une certaine quantité, ça deviens de la malhonnêteté.
# NLP ?
Posté par aurel (site web personnel, Mastodon) . Évalué à 3. Dernière modification le 01 octobre 2016 à 09:22.
Genre:
1. convertir les documents au format texte, puis avec des libs de NLP
2. faire la tokenization
3. récupérer les stems
4. calculer les distances entre les documents
cf. https://stackoverflow.com/questions/8897593/similarity-between-two-text-documents.
C'est facile à scripter, et te permet de faire un PoC rapidement. Une petite interface web ad hoc n'est sans doute pas compliquée à faire, ou tout comme le scan automatique de documents stockés dans un espace dédié sur des disques réseaux partagés. Le support d'autres langues que l'anglais dépend fortement de la lib NLP que tu utilises.
Sinon, vaguement connexe, il y a prochainement un webinaire sur le text-mining et les brevets.
Fais-moi signe si tu as envie d'en savoir plus. J'ai fréquenté pendant longtemps le monde de la recherche en suisse, et la thématique m'intéresse beaucoup: ça peut être intéressant d'en parler.
[^] # Re: NLP ?
Posté par roduit (site web personnel) . Évalué à 1.
C'est un peu ça, en effet. Je pense que la grosse difficulté est d'avoir accès aux textes. Habituellement, quand on souscrit un abonnement à une revue, une clause interdit l'utilisation de robot pour avoir un accès automatique aux données. De plus, dans notre institution, on est loin d'avoir un accès large. Beaucoup de revue ne sont donc pas accessible. Il faut que je creuse auprès du service qui s'occupe des bases de données.
En tout cas, je transmet ta réponse à mes collègues. Le webminar peut les intéresser.
[^] # Re: NLP ?
Posté par aurel (site web personnel, Mastodon) . Évalué à 2.
À noter un article qui liste 5 outils de détection de plagiat sur ZDNet.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.