Statistiques 2020 du site LinuxFr.org

Posté par  (site web personnel) . Édité par olivierweb et antistress. Modéré par Ysabeau 🧶. Licence CC By‑SA.
Étiquettes :
29
8
jan.
2021
LinuxFr.org

C’est peu dire que l’année 2020 a été particulière (pour nos visiteurs venus en DeLorean, en cabine de police britannique ou pour les rejetons de Skynet, rappelons la pandémie de Covid-19, les deux périodes de confinement en France, beaucoup moins d’occasions de voir les contributeurs du site vu le manque d’événements, etc.). Quel effet sur l’activité du site LinuxFr.org en 2020 ? Quelles évolutions en termes de trafic Web, de contenus créés, de commentaires déposés, de navigateurs utilisés, d’utilisation des fonctionnalités du site, de contribution au code, etc. Bref, qu’est‐ce qui a changé et de quelle manière durant 2020 ?

Le site rend accessible un grand nombre de statistiques (faites‑vous plaisir si vous souhaitez vous plonger dedans, c’est fait pour) ; cette dépêche résume les variations constatées en 2020.

Sommaire

Statistiques Web

La comparaison des statistiques annuelles (voir 2019 et 2020) montre une baisse des visites et des consultations (pages, fichiers, hits), avec un passage à ~796 000 hits par jour et ~39 470 visites par jour, le tout pour ~1,35 Tio par mois (qui baisse pour la première fois).

Statistiques Web 2020

Le nombre de contenus publiés en un an remonte, grâce aux dépêches, aux journaux et surtout aux liens. Le nombre de commentaires publiés en un an augmente aussi (de 8 %).

Trafic de LinuxFr.org normalisé, entre 2002 et 2020

Contenus

Au 31 décembre 2020, le site comportait environ 108 264 contenus publiés répartis ainsi :

  • 26 259 dépêches :
    • 451 dépêches publiées en 2020 (en hausse par rapport aux 444 en 2019),
    • pour la première fois, la taille moyenne (en code Markdown, hors images donc) des dépêches a diminué, pour revenir à la taille moyenne entre 2016 et 2017 ;
  • 38 800 journaux (643 en 2020 en hausse par rapport aux 560 de 2019),
  • 38 360 entrées de forums (815 en 2020 en baisse par rapport aux 894 en 2019),
  • 2348 liens (1361 en 2020 en forte hausse par rapport aux 618 en 2019),
  • 433 sondages (11 en 2020 en baisse par rapport aux 14 en 2019),
  • 149 pages de wiki (3 en 2020 en baisse par rapport aux 16 en 2019).

Pour la seconde année, le pic de publication des contenus est le mardi (talonné par le mercredi). À noter que ça correspond désormais au pic de modération aussi, voir la partie Modération plus bas).

Un jour de semaine compte 76 % de publications en plus qu’un jour de week‐end (chiffre stable par rapport à 2018).

La publication sous licence Creative Commons By-SA se fait par défaut depuis les dix ans de CC, fin 2012 pour les dépêches (permet explicitement une rédaction collaborative ou un renvoi en re‐rédaction) et les journaux (qui peuvent être convertis en dépêche) : tout naturellement, on retrouve 97 % de dépêches et 99 % des journaux sous cette licence au final (les autres étant notamment sous licence Art Libre ou autres, au choix de l’auteur).

Les dépêches collaboratives (et pas uniquement celles réattribuées à l’utilisateur Collectif) sur de multiples sujets sont toujours à compter parmi les vraies réussites du site ; nous sommes cependant toujours à la recherche de volontaires pour couvrir les nombreux sujets qui n’ont pu être abordés. Une liste des thèmes récurrents sur LinuxFr.org peut donner des idées de participation : si une dépêche n’a pas été créée dans les temps, tout inscrit peut la démarrer dans l’espace de rédaction.

Modération

Le temps moyen passé entre la création d’une dépêche (en rédaction ou directement envoyée en modération) et sa modération et publication est de 781 heures (contre 278 h en 2019 et 1 039 h en 2018) ; la mesure du temps passé uniquement en modération n’est pas actuellement disponible (et la modération retient volontairement des dépêches non urgentes pour réguler la publication) ; le temps médian est toujours passé à 17 heures (contre 16 en 2019). Il y a des demandes de statistiques dans le suivi, envoyez les demandes d’intégration Git (pull‐requests). ;-)

Le jour de modération a priori des contenus est toujours le mardi pour les dépêches et le lundi pour les sondages.

Les nombres d’interdictions de tribune et d’interdictions de poster des commentaires (pour une durée de un ou deux jours, une semaine ou un mois) sont encore en augmentation, mais restent très faibles à l’échelle du site (respectivement 155 et 172 fois, contre 66 et 77 en 2019), utilisées surtout comme restrictions immédiates sur les spammeurs, en attendant la purge du compte fautif par un admin.

Commentaires

Au 31 décembre 2020, le site comporte 1,81 million de commentaires. Le nombre de commentaires par an est en hausse pour la seconde année de 8% pour arriver à 40 432.

Il y a désormais, en moyenne, 32 commentaires par journal (29 en 2018 et 36 en 2019), 16 par dépêches (15 en 2018 et 16 en 2019), 43 par sondage (60 précédemment, mais très dépendant des sondages considérés), 8 par entrée de forum (7 en 2018 et 8 en 2019), 3 par entrée de suivi, 4 par lien (contre 3 en 2019) et une poignée par page wiki.

Le jour préféré pour commenter reste le mercredi, et un jour de semaine compte deux fois plus de commentaires qu’un jour de week‐end.

Notes

Il n’y a (toujours) pas de statistiques disponibles concernant les notes. Les entrées de suivi sur les statistiques ont trop peu avancé en 2020.

Néanmoins sur les trois derniers mois :

  • 7 256 commentaires notés « pertinents » par 999 visiteurs différents ;
  • 2 601 commentaires notés « inutiles » par 587 visiteurs différents ;
  • parmi lesquels 2 053 commentaires les deux ;
  • un total de 26 302 notes « pertinent » et 7 493 « inutile » sur les commentaires ;
  • 538 visiteurs différents ont utilisé au moins « pertinent » et « inutile » sur les commentaires ;
  • 2 167 contenus notés par 864 visiteurs différents, avec 11 938 « pertinents » et 2 257 « inutiles ».

Étiquettes (tags)

Au 31 décembre 2020, le site comporte :

  • 12 796 étiquettes, dont 11 481 étiquettes publiques (contre 11 120 fin 2019) ;
  • 103 520 saisies d’étiquettes (étiquetées en moyenne huit fois pour les étiquettes publiques et six fois pour les étiquettes privées) ;
  • les étiquettes sont réparties ainsi par contenu :
    • 45 169 pour les dépêches,
    • 34 308 pour les journaux,
    • 15 367 pour les forums,
    • 7 483 pour les liens,
    • 678 pour les pages wiki,
    • 294 pour les sondages,
    • 221 pour le système de suivi des défauts et évolutions.

Depuis le début du site, on constate en moyenne 5 étiquettes par page wiki, 3 par lien, 1,7 par dépêche, 0,9 par journal, 0,7 par sondage, 0,4 par entrée de forum et 0,1 par entrée du suivi.

On peut aussi noter une autre particularité : le jour où le plus d’étiquettes sont apposées est le lundi (et non le mardi et le mercredi, qui constituent le pic de publication des contenus et des commentaires).

Équipe de bénévoles

Il y a actuellement 6 admins Web/système, 14 modérateurs (bienvenue à bubar et bobble bubble, merci à ZeroHeure et Tankey) et 7 animateurs de l’espace de rédaction (+1, arrivée d’tisaac) qui font tourner ce site. Pour mémoire, il s’agit de bénévoles plus ou moins disponibles et donc absolument pas de 27 équivalents temps plein pour jargonner comme une entreprise. Merci pour le travail accompli.

Code et développement

Au 31 décembre 2020, le système de suivi de défauts et de demandes d’évolutions contient 192 entrées (contre 166 en 2019). On voit assez rapidement un manque de développeurs apparaître. En 2020, il y a eu 45 entrées ouvertes (contre 60 en 2019) : 29 entrées encore ouvertes venant s’ajouter à celles datant d’avant, 8 corrigées et 8 déclarées invalides). On peut noter que ceux qui ouvrent le plus d’entrées sont des membres actuels ou anciens de l’équipe du site.

C’est Bruno qui, de loin, a corrigé le plus d’entrées. Merci aussi à Adrien Dorsaz. Le temps moyen de résolution est de 116 jours (contre 115 précédemment), encore en hausse. La moitié des entrées fermées ont été traitées en moins de sept jours. On ressent donc toujours un besoin de nouveaux contributeurs côté code.

La charge moyenne sur le serveur est de 0,9 (contre 1,1 en 2019) sur la machine actuelle (baptisée gruik). La charge minimale a été de 0,7 et la maximale de 1,4.

La consommation mémoire est restée stable. Le trafic réseau sur la partie Web est en moyenne de 5,8 Mbit/s sortants (contre 6 précédemment) pour 540 kbit/s entrants (contre 550 précédemment), avec des pics à plus de deux fois ces valeurs). Le trafic réseau total est en moyenne de 7,6 Mbit/s sortants (contre 8,7 précédemment), avec des pics à 16,4 Mbit/s sortants.

Comptes utilisateur

Au 31 décembre 2020, sur les 50 688 comptes utilisateur valides existants, 2 393 ont été utilisés au cours des trois derniers mois, dont 31 % (-2 points) ont déjà rédigé des dépêches, 39 % (=) des journaux, 39 % (+1) des entrées de forums, 9 % (=) des entrées dans le système de suivi, 10 % des liens (+3) et 1 % une page de wiki ; 82 % (+2 points) ont écrit des commentaires et 44 % (+2) étiqueté des contenus (=) ; 32 % ont contribué sur au moins une dépêche ; 23 % (-1) des comptes actifs ont indiqué un site personnel, 9 % (-1) un identifiant XMPP, 25 % (=) un avatar et 5 % (=) une signature.

Côté utilisation des fonctionnalités, 3 % (=) ont demandé à ne pas voir les signatures, 5 % (=) à ne pas voir les avatars et 7 % (-1) avec le tri chronologique en page d’accueil, et à peine quelques pourcents ont changé les contenus par défaut en page d’accueil (souvent pour retirer les sondages et ajouter les journaux). Peu de feuilles de style CSS du site sont utilisées : plus de quatre visiteurs sur cinq utilisent celle par défaut ; il est facile d’en changer avec le lien Changer de style.

Huit comptes ont un karma négatif et trois ont un karma nul, soit 0 % des visiteurs actifs ; 18 % des comptes actifs durant les trois derniers mois ont été créés en 2020.

34 % des visiteurs actifs ont une adresse de courriel GMail, 12 % chez Free, 4 % chez Yahoo, 4 % chez Hotmail ou Outlook, 4 % chez LaPoste et 2 % chez Orange ou Wanadoo.

Soucis divers

Le compteur d’années sans mises en demeure reçues est constant, toujours à 0 (après deux mises en demeure en 2019 et une en 2020, voir la dépêche sur la no 3 en attendant la publication d’informations sur les no 4 et 5).

/ Only five formal notices in the default \
\   install, in a heck of a long time!    /
 -----------------------------------------
   \
    \
        .--.            / Ouep...  \
       |o_o |           \ Euh coin /
       |:_/ |            ----------
      //   \ \              \ 
     (|     | )               \
    /'\_   _/`\                \ >()_
    \___)=(___/                   (__)__ _

Depuis la création du site, statistiques liées au légal (dans les sens liés à la force publique ou à du juridique) :

  • cinq mises en demeure reçues (pour zéro assignation) ;
  • une réquisition judiciaire reçue (qui au final ne nous concernait pas, mais a donné l’occasion de discuter avec la police nationale) ;
  • un cas d’usurpation d’identité et de harcèlement type « revenge porn » (discussion avec la gendarmerie nationale).

Dans les choses toujours à dire et à faire

Il y a encore bien d’autres choses à dire et à faire concernant les statistiques du site, notamment des statistiques supplémentaires demandées par mjourdan dans le cadre de l’amélioration de l’expérience utilisateur sur le site ou les entrées de suivi concernant les statistiques.

Aller plus loin

  • # Pic de publication des contenus

    Posté par  (site web personnel) . Évalué à 1.

    Bonjour,

    La section « Contenus » contient deux paragraphes très similaires qui se contredisent un peu, voir « le pic de publication des contenus » .

    Merci pour ces statistiques et l'analyse qui en découle.

  • # Stats sur les consultations depuis l’étranger?

    Posté par  . Évalué à 1.

    Bonjour

    Le fr de linuxfr ayant clairement pris le sens de la francophonie au fil des années, serait-il possible d'obtenir des statistiques sur les consultations et publications depuis l’étranger?

    Et bien évidemment un grand merci à toute l’équipe!

  • # Accueil des nouveaux

    Posté par  (site web personnel) . Évalué à 2. Dernière modification le 19 janvier 2021 à 16:22.

    Je reste (toujours très) surpris de ne pas profiter de ces statistiques pour rappeler l'accueil des nouveaux inscrits :/ Il y a pourtant des pages wiki qui décrivent comment participer :

    • https://linuxfr.org/wiki/participer-a-linuxfr est largement améliorable
      • une mise en avant de l'accueil des nouveaux venus (relativement bien appliquée dans les forums, mais parfois rude par ailleurs que ce soit en commentaires ou comment — simplement — participer)
      • nous avons l'expérience de dyslexiques chroniques, dont la participation leur a été bénéficiaire (donc la remise en cause de l'ortografe aproximative pourrait être temporisée dans certains cas, voire corrigée — même dans les commentaires — comme je le faisais à une époque, grammalecte ou souligner en rouge ne suffit visiblement pas en prévisualisation :/)

    On parle de

    comptes actifs : 2 393 ont été utilisés au cours des trois derniers mois => c'est important que chacun connaisse les règles de modération, c'est ballot ça commence par les comportements problématiques plutôt que par des règles d'accueil de tout un chacun :/
    18 % des comptes actifs durant les trois derniers mois ont été créés en 2020 => ce serait bien d'avoir la déclinaison entre commentaires / création de contenu (journaux, dépêches, commentaires, forum…), histoire de les motiver à mieux utiliser le site (quand tu vois que des dinos ne sont même pas foutus d'avoir découvert certaines fonctionnalités en plus de 10 ans de participation… ou le soutien fourni par les modos…)

    Bref pas mal de choses à décliner sur

    • amélioration des tags
    • voir le boulot fait sur les tags il y a eu des sujets récurrents (voire récurants)
    • puis le reste notamment, rédaction où je constate que le transfert [tribune|mailing-list|tribune de dépêche] ne se transfère pas en bonne pratique proposée sur le wiki… et cela est aussi visible sur traductions-classiques
    • je laisse ouvrir les entrées sur suivi à ceux motivés par les sujets lancés icitte (vous ne serez pas responsable de l'implémenter, simplement faire le suivi vu qu'on peut éditer comme dans les forums en étant l'auteur :p)

    Et il y a des choses qui fonctionnent bien hein au jour le jour : genre choix des primables, c'est pertinent, efficace et utilisable (on va laisser faire Floxy< faire les specs :p)

    Quand je vois le rappel à l'amélioration de l'expérience utilisateur qui date de 2017 (!?), j'aurais pensé que le wiki aurait été plus utilisé pour décrire l'existant (ou le suivi planqué pour proposer des améliorations). Bah ya moyen de mieux faire, tout est en place pour bien travailler sans se disperser.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.