Bref on peut rechercher des séquences de un à cinq mots dans le corpus de livres numérisés, couvrant jusqu'à 2008. Le blog de Jean Véronis précise qu'il s'agit du « plus gros corpus linguistique de tous les temps : 500 milliards de mots (...) 4% des livres jamais publiés sur Terre ».
Ce corpus est disponible sous licence Creative Commons Attribution 3.0.
Je me suis livré à une petite recherche sur les termes pour geeks libristes, en anglais et français (liés aux lois et traités sur l'immatériel, au logiciel libre, etc.). Le plus simple est encore d'aller regarder les graphes obtenus.
Aller plus loin
- Évolution de quelques termes dans la littérature (enrichi en graphes) (56 clics)
- OWNI : L’interprétation des graphiques produits par Ngram View (21 clics)
- Blog de J. Véronis : Google: Le plus grand corpus linguistique de tous les temps (11 clics)
- Données brutes du corpus Google (CC BY 3.0) (18 clics)
- À propos du Google Books Ngram Viewer (29 clics)
# TRavaux concernant la langue française
Posté par JGO . Évalué à 2.
« Un modèle pour l'étude du changement sémantique »
http://dico.isc.cnrs.fr/fr/diachro.html
Vous aurez d'un plugin flash.
[^] # Re: TRavaux concernant la langue française
Posté par Juba (site web personnel) . Évalué à 1.
- http://www.chrisharrison.net/projects/wordassociation/index.(...)
- http://www.chrisharrison.net/projects/wordspectrum/index.htm(...)
# Quelques recherches intéressantes :
Posté par lejocelyn (site web personnel) . Évalué à 3.
http://ngrams.googlelabs.com/graph?content=Linux%2C+Microsof(...)
On observe une chute des termes Linux et de Microsoft avec la montée en utilisation du terme Google...
Si on essaie d'observer plus finement :
http://ngrams.googlelabs.com/graph?content=Ubuntu%2CLinux%2C(...)
On voit un déclin dans l'utilisation des termes Linux et Microsoft. Par contre, on voit aussi que des mots comme Ubuntu ou Debian, plus spécialisé, sont davantage employés. Peut-être faut-il relativiser le déclin de l'emploi de certains termes par le fait qu'ils soient remplacés par d'autres termes plus spécialisé. Peut-être ne parle-t-on plus beaucoup de Windows XP mais plus d'XP, de Seven, de Vista. Pareil pour Linux, peut-être parle-t-on plus de Gnu-Linux ... :D enfin d'Ubuntu, de Debian, de Fedora... L'apparition de Google n'est peut-être qu'une coïncidence. Pour vérifier cela, il faudrait avoir accès au corpus... faire des études utilisant le classement automatique des textes, etc.
# Vocabulaire étudié jusqu'ici
Posté par Benoît Sibaud (site web personnel) . Évalué à 4.
Termes DADVSI, HADOPI, LOPPSI, ACTA, ACAC, FOSS, FLOSS, DRM, GPL, BSD, ADPIC, TRIPS, LOPSI, DMCA, EUCD, open source, logiciel libre, free software, GNU, Linux, Debian, Ubuntu, Mozilla, Firefox, OpenOffice, LibreOffice, interopérabilité, format ouvert, interoperability, open standard, vote électronique, electronic voting, net neutrality, software patents, logiciel propriétaire, logiciel privateur, vente liée, bundle sale, informatique déloyale, informatique de confiance, treacherous computing, trusted computing, contenu libre, licence libre, creative commons, commons, propriété intellectuelle, intellectual property, copyright, droit d'auteur, instruction publique, éducation nationale, éducation populaire, bien commun, bien public, partage de la connaissance, partage du savoir
Je suis évidemment preneur de remarque/suggestion/correction et encore mieux d'autres sources.
# Résultats intéressants
Posté par MarbolanGos (site web personnel) . Évalué à 1.
On va là : http://ngrams.googlelabs.com/graph?content=graphene&year(...)
On s'aperçoit un truc c'est qu'il y a un pic vers les années 1900. Si on regarde dans New Scientist ils ont publié des informations sur ce matériaux ! Donc pourquoi c'est pas eux qui ont eu le prix ?
Avec cette montée d'informations facilement accessibles on va vraiment pouvoir faire des superbes choses !
[^] # Re: Résultats intéressants
Posté par MarbolanGos (site web personnel) . Évalué à 1.
[^] # Re: Résultats intéressants
Posté par LupusMic (site web personnel, Mastodon) . Évalué à 1.
[^] # Re: Résultats intéressants
Posté par MarbolanGos (site web personnel) . Évalué à 1.
C'est pour le/les pères fondateur(s) de la "technologie".
Exemple simple : toujours en physique Rontgen a découvert en 1887 (selon wikipedia qui est peut être fiable pour le coup) les Rayons X.
[^] # Re: Résultats intéressants
Posté par Thomas Douillard . Évalué à 2.
# la cote
Posté par romi . Évalué à 2.
http://ngrams.googlelabs.com/graph?content=sarkozy&year_(...)
[^] # Re: la cote
Posté par B16F4RV4RD1N . Évalué à 2.
http://ngrams.googlelabs.com/graph?content=sarkozy%2Croyal%2(...)
Only wimps use tape backup: real men just upload their important stuff on megaupload, and let the rest of the world ~~mirror~~ link to it
[^] # Re: la cote
Posté par koxinga . Évalué à 2.
http://ngrams.googlelabs.com/graph?content=Sarkozy&year_(...)
[^] # Re: la cote
Posté par romi . Évalué à 1.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.