Il existe déjà des statistiques sur les étiquettes sur le site LinuxFr.org (commentée dans chaque rétrospective annuelle) ; à l’exception de la prochaine phrase, je vais m’efforcer de ne parler que de choses qui n’y figurent pas déjà. La base de données contient actuellement environ 13 500 étiquettes, dont environ 11 600 étiquettes publiques, pour un total d’environ 123 000 étiquetages sur des contenus publiés.
Citation sans rapport : Il a d’ailleurs écrit lui-même qu’aucune étiquette ayant cours dans le monde occidental ne saurait lui convenir. (source)
Commençons par quelques informations en vrac :
- les étiquettes sont assez peu visibles sur le site si vous utilisez un navigateur sur mobile. Cela pourrait être un problème pour leur évolution.
- La capacité à bloquer l’étiquetage n’est pas encore codée et c’est bien dommage vu certains comportements (injures en étiquettes, étiquettes problématiques, etc.).
- Les étiquettes dites « sémantiques » ne sont pas encore en place.
- Concernant l’accentuation impôts et impots sont une seule et même étiquette, et la forme affichée est celle saisie au premier étiquetage (hors intervention en base de données pour corriger donc).
- La taille d’une étiquette est limitée à 64 caractères.
- Les tirets sont à utiliser pour les mots composés comme auto-hébergement ou parce que cela fait partie d’un nom comme COVID-19.
- Les soulignés sont à utiliser pour remplacer les espaces et associer des mots, par exemple les noms de personnes comme linus_torvalds ou les concepts comme réseau_social ou jeu_libre.
- Une modération de l’étiquetage est faite par l’équipe du site, notamment pour bien choisir les étiquettes, supprimer les doublons, regrouper les concepts, etc. Citation sans rapport : Sous des étiquettes opposées, sache reconnaître la même pensée, et sous des étiquettes semblables des conduites opposées. (source). Un des premiers choix à faire est singulier ou pluriel (jeu ou jeux ?), le choix par défaut étant le singulier. Mais d’autres questions peuvent se poser : genre, traduction ou franglais, acronyme, mettre ou non le second prénom d’une personne, mot régional ou national, etc.
- Il existe un script
tag_me.sh
qui permet d’étiqueter massivement (mais manuellement) en donnant une étiquette et une recherche associée (par exemple étiquette lennart_poettering et toutes les combinaisons justes ou erronées qui ont pu être saisies sur le prénom, le nom ou les deux). - Le recours à ce script se fait dans des situations variées : nécrologies pour retrouver les mentions de la personne disparue (ou l’événement ou le projet disparu), version majeure d’un logiciel, recherche sur un projet qui donne de maigres résultats alors que l’on sait qu’il existe plein de contenus sur le sujet, modération suite à un signalement de doublon ou de faute, constat qu’un événement a été étiqueté en 2020 et en 2022 mais pas en 2021, etc.
- En bas de page, on trouve un affichage des « étiquettes (tags) populaires » (en ce moment libreoffice, fosdem, lennart_poettering, onlyoffice, wallabag, police_de_caractères, académie_française, police_institution, ada, complotisme, agenda_du_libre, rust), influencé un peu par les étiquetages des visiteurs et beaucoup par les étiquetages massifs.