Petite curiosité sur la page https://linuxfr.org/statistiques/tags : elle affiche dans "Répartition annuelle des 151280 étiquetages" 64 étiquetages de liens en 2011. Or il me semble que les liens n'existaient pas en 2011.
D'où vient cette erreur?
Petite curiosité sur la page https://linuxfr.org/statistiques/tags : elle affiche dans "Répartition annuelle des 151280 étiquetages" 64 étiquetages de liens en 2011. Or il me semble que les liens n'existaient pas en 2011.
D'où vient cette erreur?
# Interprétation de la statistique
Posté par Adrien Dorsaz (site web personnel, Mastodon) . Évalué à 2 (+0/-0). Dernière modification le 27 novembre 2022 à 14:46.
Hello,
Ce que le code source dit, c'est que:
Cependant, je ne suis pas sûr que la statistique soit vraiment intéressante: on pourrait avoir 1 lien qui a été lié à 64 tags crées en 2011 et avoir le même résultat que si 1 tag de 2011 avait été lié à 64 liens.
[^] # Re: Interprétation de la statistique
Posté par Benoît Sibaud (site web personnel) . Évalué à 4 (+0/-0).
les étiquetages ont une date de création, les contenus ont une date de création, mais les étiquettes n'ont pas de date de création (si ce n'est le premier étiquetage).
cf https://github.com/linuxfrorg/linuxfr.org/blob/master/db/schema.rb#L330
ou
https://github.com/linuxfrorg/linuxfr.org/blob/master/db/schema.png
[^] # Re: Interprétation de la statistique
Posté par Adrien Dorsaz (site web personnel, Mastodon) . Évalué à 2 (+0/-0).
Tu as raison, j'ai relu la requête SQL et je me suis bien trompé dans l'interprétation de celle-ci et de la page de statistiques :)
# Étiquetage massif
Posté par Benoît Sibaud (site web personnel) . Évalué à 3 (+0/-0).
Une part non négligeable (probablement largement majoritaire) des étiquettes vient d'étiquetage massif automatisé : celui initial à la mise en place des étiquettes, et d'autres depuis, pour réétiqueter massivement sur des noms de personnes, de projets, d'entités, etc. Et forcément ça concerne aussi des contenus antérieurs à 2011 (par contre on devrait pouvoir différencier date du contenu et date de l'étiquetage).
[^] # Re: Étiquetage massif
Posté par Benoît Sibaud (site web personnel) . Évalué à 3 (+0/-0).
Et j'ai un souvenir d'avoir antidaté des étiquetages à l'Epoch RoR (2011) lors d'un bug sur l'affichage des étiquetages récents (on était passés en complexité au carré du nombre d'étiquetages récentes au lieu du nombre d'étiquetages récents, et ça se sentait bien sur le CPU, d'où le fait d'en sortir des étiquetages récents quand on vient d'en ajouter massivement par milliers).
[^] # Re: Étiquetage massif
Posté par Benoît Sibaud (site web personnel) . Évalué à 3 (+0/-0).
Et je pourrais recaler les étiquettes antidatées en me basant sur les timestamps de celles avant et après (par id).
(Dans le même style, il y a les dépêches de 1999 retrouvées des années plus tard, ayant donc des id élevés).
[^] # Re: Étiquetage massif
Posté par Benoît Sibaud (site web personnel) . Évalué à 4 (+0/-0).
Fait.
Envoyer un commentaire
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.