Journal Graphiques et cartes Grafana de l'évolution du COVID-19

Posté par  (site web personnel) . Licence CC By‑SA.
29
16
juin
2020

Plop,

J'ai fait des terrifiants jolis graphiques sur l'évolution du Coronavirus/COVID-19 par pays et globalement dans le monde avec les données de Johns Hopkins University (JHU). Le résultat est accessible sur coronavirus.cyberbits.eu.

Sous le capot, c'est un script pas très propre qui télécharge des fichiers CSV mis à jour quotidiennement par JHU, puis les importe dans une base de données InfluxDB et en fait des graphiques et cartes générés avec Grafana. Bien sûr, tout le code est disponible ici (AGPLv3+).

N'hésitez pas si vous avez des idées d'améliorations ou des graphiques plus pertinents en tête, je peux aussi créer des comptes utilisateurs sur Grafana pour vous laisser créer vos propres visualisations s'il y a des intéressés.

Bon courage et prenez soin de vous :)

  • # Une mise en contexte

    Posté par  . Évalué à 5.

    Je regardais l’évolution de l'épidémie sur ce site : https://boogheta.github.io/coronavirus-countries et je ne comprenais le grand nombre de cas actifs (~90k en France) par rapport au nombre de nouvelles infection (~150). Je me serais attendu à ce que "nombre de cas actifs = nombre de nouvelles infections x durée de la maladie" et ça ne colle pas.

    En cliquant sur le point d'interrogation sur le site pré-cité, il explique que le nombre de cas actifs = nombre de cas cumulés - nombre de rémissions (sortie d’hôpital) - nombre de morts. Je pense donc que les personnes testées positives qui ne rentrent pas à l’hôpital resteront à jamais comptabilisées comme des personnes actives.

    Il serait, selon moi, intéressant d'expliquer comment on arrive à ce nombre de cas actifs quelque part sur la page.

    Dans tous les cas, beau travail ! :-)

  • # un graphique utile de plus

    Posté par  . Évalué à 3.

    pas mal effectivement.

    Il manque un graphique dans ce que tu as fait : le taux de mortalité pour 100 000 habitants.
    C'est plus parlant que le graphique utilisé par tout le monde de taux de mortalité lié au nombre de personnes dépistées qui lui montre simplement les pays qui ont peu dépisté !

    Avec ce taux, il y a une nouvelle lecture qui change pas mal de choses, on voit apparaître les pays qui ont été les plus touchés.

    • [^] # Re: un graphique utile de plus

      Posté par  . Évalué à 3.

      • [^] # Re: un graphique utile de plus

        Posté par  . Évalué à 1.

        oui c'est exactement ça.

        on voit que le plus impacté est la belgique et on voit aussi que la suède, le brésil, les états unis qui n'ont pas confiné ou pas beaucoup continuent d'être impactés contrairement aux pays qui ont confiné

      • [^] # Re: un graphique utile de plus

        Posté par  . Évalué à 2.

        Il faut toutefois faire attention à réaliser un traitement différent pour les petits pays sinon Saint Marin et le Diamond Princess explosent tous.

        On risque de se retrouver avec des stats comme il y a 2 papes au km² au vatican.

    • [^] # Re: un graphique utile de plus

      Posté par  . Évalué à 7. Dernière modification le 17 juin 2020 à 10:15.

      Même avec ça tu n'es pas vraiment sûr que ce sera comparable, encore faut-il qu'ils comptent tous la mortalité de la même façon : par exemple l'Espagne a changé sa façon de comptabiliser les décès quotidiens il y a peu et du coup il n'y en a plus ou presque : ils ne comptent plus forcément toutes les personnes âgées qui ont aussi d'autres pathologies (en gros, quand ils ne sont pas sûrs de quoi ils sont vraiment morts, il me semble que l'Allemagne a fait un peu pareil à un moment) et, en plus, les cas confirmés trop en retard ne sont plus reportés dans les données quotidiennes.

      • [^] # Re: un graphique utile de plus

        Posté par  (site web personnel) . Évalué à 3.

        Oui tous les pays ne comptent pas de la même façon et cela empêche parfois de comparer les pays entre eux. Il y a beaucoup de choses qui faussent les chiffres, entre autres :

        • les changements de méthode de comptage comme la France qui ne comptait pas les cas et décès en EHPAD au début
        • des nombres de nouveaux cas « négatifs dus à des rattrapages par Santé publique France d'erreurs de comptage sur les jours précédents » (source)
        • « Ce total ne prend pas en compte les personnes décédées à domicile d'une cause attribuée à la Covid-19 » (source)

        Je pense que ces graphiques sont plus pertinents pour suivre l'évolution dans le temps plutôt que de comparer les chiffres absolus.

        Bref, pour vraiment connaître l'impact du virus, il faudrait récupérer le nombre de morts quotidiens toutes causes confondues par pays/région et le comparer avec la moyenne des années précédentes mais c'est un travail de recherche énorme que personne n'a fait à l'échelle mondiale à ma connaissance. Voilà un exemple sur quelques pays/villes : https://www.economist.com/graphic-detail/2020/04/16/tracking-covid-19-excess-deaths-across-countries

        0xEEC73D5809A98A9B

        • [^] # Re: un graphique utile de plus

          Posté par  (Mastodon) . Évalué à 2.

          le plus simple pour avoir des chiffres assez fiable au final, c'est de comparer la mortalité totale par rapport aux autres années. De ce fait on prend en compte les morts dus au covid et ceux indirects du éventuellement à une baisse du niveau des soins/saturations des moyens hospitaliers à certains moments de l'année.

          Mais tu ne peux avoir que des chiffres sur une période donnée, pas au jour près.

          • [^] # Re: un graphique utile de plus

            Posté par  . Évalué à 2.

            le plus simple pour avoir des chiffres assez fiable au final, c'est de comparer la mortalité totale par rapport aux autres années.

            Ça n'avance pas plus car la mortalité n'est pas fixe d'une année à l'autre.
            Il me semble qu'en 2020 en France il y a moins de mortalité qu'en 2019. Du coup le COVID est bénéfique ? :-)

            • [^] # Re: un graphique utile de plus

              Posté par  (site web personnel) . Évalué à 6. Dernière modification le 18 juin 2020 à 09:20.

              Euh, j'ai pas l'impression que la courbe 2020 soit vraiment en dessous des autres, si ?

              Nombre de décès quotidien en France

              • [^] # Re: un graphique utile de plus

                Posté par  . Évalué à 5. Dernière modification le 18 juin 2020 à 10:44.

                Comme il parle de 2020 dans son ensemble (tu prends juste la période d'épidémie), je suis allé vérifier sur le site de l'insee : si mes calculs sont bons, à partir des données mensuelles, on a 18000 décès en plus cette année au premier mai qu'en 2019. Après, c'est vrai que c'est quand même sensiblement moins que le nombre de décès attribués au covid (autour de 29000 si je me souviens bien). Un article de l'insee explique que pour analyser il faut regarder ce qui se passe avant et après. Ils émettent l'hypothèse que, comme la grippe de cette année a été clémente (plus douce que celle de 2019 qui était proche de la moyenne), elle « a épargné des personnes très fragiles, ce qui a sans doute accru la population à risque face à cette épidémie ». De plus, ils disent du coup qu'on pourrait par la suite constater “un « déficit de mortalité » correspondant aux vies écourtées par l’épidémie”, et concluent que « ce travail d’évaluation oblige à beaucoup d’humilité dans les projections aujourd’hui, et dans les interprétations demain. » Les chiffres (non définitifs) pour le mois de mai sont similaires à 2019.

                Bref, c'est encore tôt pour vraiment analyser et comparer même avec les chiffres toutes causes confondues (même s'ils sont en effet au moins fiables en soi).

                • [^] # Re: un graphique utile de plus

                  Posté par  . Évalué à 2.

                  Arf, j'ai mal copié-collé l'url pour les données mensuelles mais je peux plus modifier : voilà. Au passage, je remarque à vue d'œil que certaines années, si les chiffres sont bons, il y a du y avoir des épidémies (ou autres catastrophes ?) assez terribles : par exemple en 1953 et 1949 il y a 11 et 7 mille morts de plus pour la même période (janvier-avril) que cette année, alors qu'il y avait quand même moins de population au total qu'aujourd'hui ; 1963 a été dur pour la même période aussi (5000 en moins que cette année seulement). Après, je sais pas si ça a beaucoup de sens de comparer juste cette période (déjà souvent l'épidémie de grippe commence en décembre).

                  • [^] # Re: un graphique utile de plus

                    Posté par  (Mastodon) . Évalué à 3.

                    Je n'ai pas les dates exactes à l'année et au mois près car mes cours d'histoires sont un peu loin mais on a eu la guerre d'Indochine et la guerre d'Algéries dans ces périodes. Pas impossible non plus que des décès dans des colonies en guerre aient pu être officialisés en bloc à postériori.

                    • [^] # Re: un graphique utile de plus

                      Posté par  . Évalué à 2.

                      Les colonies ne sont pas comptées, c'est des données pour la france métropolitaine a priori ; au pire les pertes militaires seraient comptées, mais en un seul mois elles ne devraient pas être à ce point significatives.

                      Un report en bloc après coup pourrait l'expliquer, en effet.

                      Après, j'ai cité ces années, car c'était plusieurs mois à la suite assez élevés : des années où ça monte au-delà des 60 mille pour au moins un mois en hiver, c'est pas normal mais il y en a quand même plusieurs déjà à l'époque (décembre 1969 c'est même presque 75000) et ça le reste (par exemple janvier 2017 dépasse d'un peu avril 2020 avec 66000). Le seul qui se démarque vraiment au point de paraître vraiment improbable, surtout par rapport à plein d'autres mois à la même époque, c'est janvier 1949 avec 87000.

                • [^] # Re: un graphique utile de plus

                  Posté par  . Évalué à 3.

                  il parle de 2020 dans son ensemble

                  J'ai entendu ça sur la radio France-je-ne-sais-plus-laquelle. Du coup pas de date précise car je n'ai pas noté.
                  De tête c'était fin mars mais pas certain. Vu le graphique affiché par Matthieu Moy que c'est peut-être ça.

                  Mon message d'origine réagissait à « pour avoir des chiffres assez fiable ».
                  Visiblement ça n'apporte pas du tout de fiabilité. Par exemple pour le mois de mars, ça veut dire qu'il y a eu des vies sauvées par le COVID ?

                  Comme tu l'indiques, le graphique qu'on voit ne change rien au problème, ça ne permet pas d'isoler une cause. Même si on voit une surmortalité sur le graphique et qu'on n'a pas entendu parler d'une autre cause, on ne peut pas avoir combien sont imputables au COVID car on se base sur quelle référence ? 2019 ? 2018 ? La moyenne des 5 dernières années ?

    • [^] # Re: un graphique utile de plus

      Posté par  (site web personnel) . Évalué à 3.

      Effectivement, je m'étais déjà fait cette réflexion mais j'avais la flemme de chercher une deuxième source de données avec le nombre d'habitants par pays et de croiser les données… Mais je vois qu'ils ont ajouté cette info donc cela devrait être relativement rapide à faire maintenant. Merci pour la suggestion :)

      0xEEC73D5809A98A9B

  • # Attention aux échelles

    Posté par  (site web personnel) . Évalué à 3.

    Sur "Recovery & Death rate" il y a deux problèmes de lisibilité (aussi considéré faute-peine-de-mort pour un statisticien) :

    • l'ordonnée ne démarre pas à 0
    • les deux courbes qui ont bien la même unité (taux) ne partagent pas la même échelle alors que leur superposition encourage à les comparer (et les axes distincts nous en empêchent)

    Oui je sais ça applatit les courbes et c'est moins "sexy", mais des fois la vérité c'est que les courbes sont assez plates et c'est une information importante.

    • [^] # Re: Attention aux échelles

      Posté par  . Évalué à 3.

      l'ordonnée ne démarre pas à 0

      C'est un dogme qu'on voit souvent revenir mais qui me semble revenir en critique un peu trop souvent. Quand, c'est fait pour tromper, c'est effectivement un prolème, mais parfois c'est bien d'avoir un zoom sur une partie de l'échelle. Par exemple, la température en été en Kelvin ou en Fahrenheit, ça n'a aucun intérêt de commencer l'échelle à 0.

      En plus, ici, le graphe ne commence pas à 0 mais à 10% et 2%, déjà, on sait qu'on n'a pas 0% de recovery ou de death, donc on n'y arrivera pas avant longtemps, ensuite, si tu tiens à mettre les courbe à 0, tu ne vas pas non plus les changer énormément.

      Il semble un peu limite de le condamné à la peine de mort dans ce cas.

      « Rappelez-vous toujours que si la Gestapo avait les moyens de vous faire parler, les politiciens ont, eux, les moyens de vous faire taire. » Coluche

      • [^] # Re: Attention aux échelles

        Posté par  (site web personnel) . Évalué à 4.

        Il semble un peu limite de le condamné à la peine de mort dans ce cas.

        Je suis d'accord. On devrait réserver ce genre de peine à des cas plus graves comme la confusion entre infinitif et participe passé.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.