Salut forum,
Connais-tu un moyen de télécharger la liste des mots français du Wiktionaire ? J'aurais besoin d'un dico pour un jeu et ça me semble être la meilleure source proposant les mots et les conjugaisons avec un contrat d'utilisation sympa.
Tout ce que j'ai trouvé pour l'instant ce sont les fichiers de http://dumps.wikimedia.org/frwiktionary/ qui listent les titres des pages. Malheureusement ces titres sont parfois des mots étrangers.
# aspell
Posté par matthieu bollot (site web personnel, Mastodon) . Évalué à 3.
J'ai eu besoin d'une liste similaire mais du coup moi je l'ai choppé avec aspell en faisant :
aspell -d fr dump master | aspell -l fr expand > dico.txt
par contre pour des mots-flêchés par exemple c'est pas terrible il manque les noms propres, les rivières du genre AA etc. mais c'est déjà une très bonne base.
Aucune idée pour le wiktionnaire mais je checkerai la soluce si tu trouves et que c'est mieux rempli.
# Kiwix
Posté par robertix . Évalué à -6.
kiwix est ta solution
[^] # Re: Kiwix
Posté par nonas . Évalué à 1. Dernière modification le 01 juillet 2015 à 19:09.
Oui, tu peux regarder cette page : https://fr.wiktionary.org/wiki/Aide:Consulter_le_Wiktionnaire_hors-connexion
D'après les liens torrent : 2.1 Go avec les images, 1.1 Go sans.
Je n'y vois pas de mention faisant état d'une licence différente de celle du site.
# La bdd d'anagrime
Posté par psychoslave__ (site web personnel) . Évalué à 3.
Un des contributeurs de wiktionnaire à fait une base de donnée pour exploiter facilement tout ça dans anagrime. La page précédente propose un lien vers la base SQL correspondante.
# grammalecte
Posté par _kaos_ . Évalué à 2.
Salut,
Il y a eu des infos récentes sur grammalecte.
Ça peut être un point d'entrée. Ce n'est évidemment pas le vocabulaire du Wiktionaire, mais pour une source de mots, il y a matière.
Matricule 23415
# wordnet.
Posté par deuzene (site web personnel) . Évalué à 1.
Ça ne répond pas vraiment à ta question, j'ai juste découvert ça hier :
Wordnet
et Wolf
Si quelqu'un utilise, je serais curieux de voir ce qu'on peut en tirer.
« Il vaut mieux mobiliser son intelligence sur des conneries que mobiliser sa connerie sur des choses intelligentes. »
# Parseur de dump
Posté par Jona . Évalué à 1.
J'avais écrit des scripts pour parser le dump du wiktionnaire à l'époque.
Cfr: https://fr.wiktionary.org/wiki/Utilisateur:Jona#Scripts
Ça devrait pas être trop dur de l'adapter à tes besoins.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.