Journal Covid-19 : bon, mais alors ? Ça repart ou pas ?

Posté par  (site web personnel, Mastodon) . Licence CC By‑SA.
33
25
juil.
2020

Sommaire

Introduction

On en parle partout. On impose le port du masque. Les anxieux sont flippés et critiquent les autres. Les autres se moquent des anxieux. Twitter est en ébulition.

Alors quoi ? Alors j'en ai eu marre et j'ai souhaité me faire une idée par moi-même. Covid-19 : ça repart ou ça ne repart pas ?

Recrudescence de cas ou de décès ?

Les données officielles pour référence

Des données officielles sont mises à disposition par l'état sur https://www.data.gouv.fr et en particulier sur https://www.data.gouv.fr/fr/datasets/donnees-hospitalieres-relatives-a-lepidemie-de-covid-19/

Je me suis basé sur le second fichier nommé donnees-hospitalieres-nouveaux-covid19-2020-07-24-19h00.csv

Ce fichier contient les informations suivantes (dans l'ordre) :

  • département
  • date
  • nombre d'hospitalisations
  • nombre d'entrée en réanimation
  • nombre de décès
  • nombre de retour à domicile

Création d'une base de données

A l'aide de SQLite Database Browser, j'ai créé une base savamment intitulée covid

J'y ai créé une table covid :

CREATE TABLE "covid" (
  `departement` TEXT,
  `jour` DATE,
  `hospitalisation` INTEGER,
  `reanimation` INTEGER,
  `deces` INTEGER,
  `retouradomicile` INTEGER,
  PRIMARY KEY(`departement`,`jour`)
);

Injection des données extraites du fichier CSV

Ceci est un exercice ! Ceci est un exercice !

Je vous laisse le choix des armes :

  • scripting python3
  • bricolage à base de "remplacer tous" via votre éditeur de texte préféré.

Je ne vous dirai pas comment j'ai fait car vous allez sans doute vous moquer de moi parce que je n'ai pas écrit une ligne de code :-p

L'injection SQL se fera via l'outil cité au dessus : SQLite Database Browser.

Requêtage des données avec SQLite Database Browser

Toujours avec mon outil graphique, j'ai agrégé les données par date pour en extraire la quintescence : le nombre de nouvelles hospitalisations et le nombre d'entrées en réanimation :

SELECT
  jour,
  SUM(hospitalisation),
  SUM(reanimation)
FROM
  covid
GROUP BY
  jour
ORDER BY
  jour ASC

Cela me donne 129 lignes correspondant à chaque jour entre le 19/03/2020 et le 24/07/2020 (en réalité 128 car une ligne vide s'est glissé dans le jeu de données)

Graphe des données avec LibreOffice Calc

Hop, hop, hop, grâce à mon environnement graphique haute-performance, je lance LibreOffice Calc et d'un simple copié/collé je récupère mes données dans mon tableur préféré.

Je sélectionne toutes les données, je choisis le menu insert > chart > columns puis je valide, je valide, je valide et hop, me voici propriétaire d'un superbe graphe qui montre le redémarrage foudroyant réel de l'épidémie :

Bon… C'est pas évident, évident comme redémarrage… du coup je refais l'opération mais en ne prenant que les 30 derniers jours et ça me donne une vue plus précise…

Bon… C'est pas évident, évident comme redémarrage… ça doit être autre chose alors…

Augmentation du nombre de contaminés ?

D'après l'étude ci-dessus, on ne peut pas parler de recrudescence d'hospitalisation ni de réanimations… Voyons si tous ces articles de média ne s'appuyent pas tout simplement sur une augmentation du nombre de cas de contamination (ou infection ?) identifiés.

Les données officielles pour référénce

Sur le site https://www.data.gouv.fr/ sont publiées les données relatives aux résultats des tests virologiques COVID-19

Le fichier utilisé est sp-pos-quot-fra-2020-07-24-19h15.csv

Ce fichier contient les informations suivantes (dans l'ordre) :

  • pays
  • jour
  • Nombre de test positif chez les femmes
  • Nombre de test positif chez les hommes
  • Nombre de test positifs
  • Nombre de test effectués chez les femmes
  • Nombre de test effectués chez les hommes
  • Nombre de test réalisés
  • Classe d'age

Ce qui va nous intéresser :

  • jour
  • nombre de tests positifs
  • nombre de test réalisés

Bon, et on va garder la classe d'age parce que c'est quand même une donnée intéressante.

Note : les modalités de publication de données ayant changé au court de l'épidémie, les données disponibles dans ce fichier commencent au 13 mai 2020.

Création d'une base de données

Cette fois-ci, je ne peux pas appeler ma table covid vu que je l'ai déjà créée. Alors je vais l'appeler covid_test.

CREATE TABLE "covid_test" (
  `jour` DATE,
  `tests_positifs` INTEGER,
  `tests` INTEGER,
  `classe_age` INTEGER,
  PRIMARY KEY(`jour`,`classe_age`)
);

Injection des données extraites du fichier CSV

Même exercice que tout à l'heure, mais cette fois-ci je vous donne un indice pour construire la requête SQL : la syntaxe à suivre est la suivante :

INSERT INTO covid_test(jour, tests_positifs, tests, classe_age)
VALUES
  ("2020-05-13", "13", "1276", "9"),
  ("2020-05-13", "28", "1684", "19"),
  [...]
  ("2020-07-21", "1029", "78151", "0");

Requêtage des données avec SQLite Database Browser

Cette fois-ci on va simplement lister par date le nombre de tests et de tests positifs, toutes classes d'âge confondues :

SELECT
  jour,
  SUM(tests) AS tests,
  SUM(tests_positifs) AS tests_positifs,
  1.0*SUM(tests_positifs)/SUM(tests) AS ratio_positivite
FROM covid_test
GROUP BY jour
ORDER BY jour ASC

Graphe des données avec LibreOffice Calc

Les données tests / tests positifs sont les suivantes :

  • en bleu le nombre de tests - l'échelles est à gauche
  • en rouge le nombre de tests positifs - l'échelles est à droite

Une première lecture donne : "on a un nombre de tests positifs équivalent à la deuxième quinzaine de mai, mais sur un nombre de tests nettement plus important", ce qui ne me semble pas inquiétant.

En réfléchissant et en écrivant cet article il m'a semblé que le ratio nombre de tests positifs vs nombre de tests total était intéressant ; ça donne ça :

En fait, en y réfléchissant, ce qui me semble plutôt intéressant c'est de savoir si le nombre de tests positifs augmente à la même vitesse que le nombre de tests compte-tenu pour une population donnée…

Et ça tombe bien, figurez-vous, car des personnes ont réfléchi à tout ça !

Indicateurs de suivi de l’épidémie de COVID-19

Des données sont disponibles pour suivre l'épidémie et sont disponibles à l'adresse suivante : https://www.data.gouv.fr/fr/datasets/indicateurs-de-suivi-de-lepidemie-de-covid-19/

Quatre indices sont mesurés :

  1. L'activité épidémique (ou taux d'incidence) : c'est le nombre de cas positifs rapporté à la population. Il augmente depuis le 08 juin 2020. Rien de récent. Le fait que ça augmente ne me choque pas vu qu'on teste plus qu'avant (cf. courbes précédentes)

  2. Taux de positivité des tests virologiques : ratio tests positifs sur tests total. Il augmente depuis le 13 juillet. Ça correspond au dernier graphe ci-dessus. C'est pas flagrant sur le graphe, mais avec le coefficient 100 qui est appliqué pour créer l'indicateur (ça permet d'exprimer des valeurs "pour dix-mille" en "pourcent"), ça "parle". Après, de par mon parcours scientifique, je trouve pas évident de tirer une tendance générale compte-tenu des chiffres que l'on a.

  3. Le Facteur de reproduction du virus (évolution du R0) : nombre de personnes contaminées par chaque malade. On ne sait pas comment il est calculé mais il augmente. Faut faire confiance.

  4. Tension hospitalière sur la capacité en réanimation : cet indicateur ne fait que diminuer.

Conclusion

Il est tard. Je suis déçu. Le seul indicateur qui me paraît possiblement inquiétant est le Taux de positivité des tests virologiques.

Le 19 juillet, il était officiellement de 1,2182.

D'après mes calculs basés sur sp-pos-quot-fra-2020-07-24-19h15.csv :

  • le 19 juillet il était à 1,7245
  • le 20 juillet il était à 1,2177
  • le 21 juillet il était à 1,3165

note : le taux officiel fourni par data.gouv.fr est calculé sur une semaine là où mon calcul est basé sur une valeur journalière.

Je repasserai dans 2 semaines pour comparer les valeurs.

Et finalement, ça repart ou ça ne repart pas ? J'en sais rien, mais j'ai refait un peu de SQL, ça faisait longtemps, ça dérouille :)

Allez, et pour ne pas vous laisser sur votre faim, si on reprend les premiers chiffres et qu'on agrège par semaine, ça donne le graphe suivant :

Bon week-end !

p.s : outre les logiciels libres dont j'ai précédemment parlé, je me suis également appuyé sur remarkable, firefox, gimp et shutter pour rédiger ce journal

  • # Automatisation prématurée

    Posté par  . Évalué à 10. Dernière modification le 25 juillet 2020 à 07:18.

    Je ne vous dirai pas comment j'ai fait car vous allez sans doute vous moquer de moi parce que je n'ai pas écrit une ligne de code :-p

    On pourrait aussi bien se moquer de quelqu'un qui a conçu, écrit, débogué une macro ou un script à usage unique pour faire ça, et qui y a passé plus de temps qu'à effectuer la tâche manuellement.

    En général, pour ça, je quitte mon IDE (dont je ne sais pas me servir, son rôle est de paraître productif au bureau), je lance Kate (parce qu'à un moment, il faut être un peu efficace), et c'est parti les éditions multilignes et les chercher-remplacer à coup d'expressions régulières… ou pas (il y en a qui utiisent gedit, c'est ok aussi, tout le monde n'a pas la même chance).

    • [^] # Re: Automatisation prématurée

      Posté par  . Évalué à 6.

      On pourrait aussi bien se moquer de quelqu'un qui a conçu, écrit, débogué une macro ou un script à usage unique pour faire ça, et qui y a passé plus de temps qu'à effectuer la tâche manuellement.

      Le chemin est des fois aussi intéressant que la destination.

      Il n'y a pas de mauvaise façon de faire tant qu'elle lui a convenu et qu'elle amène au résultat.

      https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll

      • [^] # Re: Automatisation prématurée

        Posté par  . Évalué à 5. Dernière modification le 25 juillet 2020 à 08:11.

        Bien sûr.

        En fait, il n'y a même pas besoin qu'elle amène au résultat : si tu préfères concevoir, écrire, déboguer un script pour le fun, tu as déjà gagné même si tu n'es pas arrivé au bout. Si tu l'as fait parce que tu trouves cela plus intéressant, tu as peut-être appris des choses ou passé un bon moment, ce qui vaut déjà le coup, et en plus tu sauras peut-être réaliser des tâches similaires plus rapidement plus tard.

        Peut-être même que concevoir, écrire, déboguer un script t'a pris plus de temps mais t'a moins endormi le cerveau ou t'a plus mis la motivation que faire un truc ennuyeux mais moins long, et du coup tu es plus efficace / rapide sur toute la suite.

      • [^] # Re: Automatisation prématurée

        Posté par  . Évalué à 3.

        Du coup, je me dis qu'il y avait peut-être juste besoin de faire l'import du csv dans Calc puisqu'il est déjà utilisé et de faire appel aux fonctions d'agrégation 🤔🙂

        • [^] # Re: Automatisation prématurée

          Posté par  (site web personnel, Mastodon) . Évalué à 5. Dernière modification le 25 juillet 2020 à 08:13.

          Oui c'est probable en fait. Je ne les connais pas et vu l'heure avancée j'ai eu la flemme de chercher :-/

          #tracim pour la collaboration d'équipe __ #galae pour la messagerie email __ dirigeant @ algoo

    • [^] # Re: Automatisation prématurée

      Posté par  . Évalué à 3.

      Et comme je ne crains pas les moqueries et pour simplifier la vie de ceux qui voudraient reproduire, ça ferrais un truc comme ça :

      sed 's/\x0D$//' donnees-hospitalieres-nouveaux-covid19-2020-07-24-19h00.csv | awk -F\; 'NR!=1{print "INSERT INTO covid (departement,jour,hospitalisation,reanimation,deces,retouradomicile) VALUES(\""$1"\",\""$2"\","$3","$4","$5","$6");"}' | sqlite3 covid.db

      sqlite n'aime pas qu'on groupe trop les insertions de données. J'ai lu quelque par qu'il est limité à 500, mais chez moi même 200 lignes ça ne lui plaisait pas donc je suis parti sur ligne par ligne, ça prend quelques secondes.

      https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll

  • # R0

    Posté par  . Évalué à 5.

    Le Facteur de reproduction du virus (évolution du R0) : nombre de personnes contaminées par chaque malade. On ne sait pas comment il est calculé mais il augmente. Faut faire confiance

    Je m'étais pose la même question. C'est clairement pas simple mais c'est la métrique clé pour un gouvernement pour comprendre l'épidémie.

    De base, c'est censé être la dérivée du nombre de cas, mais compte tenu des temps d'incubation et des périodes ou les malades sont contagieux, ça complique un poil les choses. J'avais trouve cette ressource qui en dis un peu plus et donne quelques liens :

    http://covid-ete.ouvaton.org/Rapport1_R0_France.html

    • [^] # Re: R0

      Posté par  (site web personnel) . Évalué à 9.

      Et si je ne m'abuse, on ne devrait pas dire R0 mais Rt ou Re parce que R0 ça suppose une population entièrement vulnérable.

  • # A comparer avec l'analyse "officielle"

    Posté par  . Évalué à 7.

    Merci pour cette petite analyse !

    Toute cette analyse a déjà été faite, et montrée en détails, ici:
    https://www.santepubliquefrance.fr/maladies-et-traumatismes/maladies-et-infections-respiratoires/infection-a-coronavirus/documents/bulletin-national/covid-19-point-epidemiologique-du-23-juillet-2020

    Voir notamment le PDF à la fin, qui rejoint plusieurs de tes graphiques, tout en poussant encore plus loin certains points. Il peut être intéressant de comparer ces analyses, et voir quelle critique on pourrait en tirer.

    Quand on voit qu'en Italie, qui a été touchée à peu près comme la France ou pire, il y a environ moitié moins de cas détectés sur un nombre de tests similaire (enfin, je crois, si quelqu'un a une source fiable pour l'Italie…), on se dit qu'on peut faire mieux.

  • # Attention au retard !

    Posté par  (site web personnel) . Évalué à 6.

    Se baser sur les hospitalisations et les entrées en réanimation, c'est pas mal car ce sont les seuls indicateurs qui n'ont pas vraiment changé depuis le début de l'épidémie. Mais ceux-ci sont bien plus en retard par rapport à la situation réelle que les autres indicateurs étudiés dans l'article.

    Ensuite, se baser sur le taux de cas détectés plutôt que sur le nombre de cas positifs ne se justifie pas forcément. La politique en terme de test a-t-elle changé ces dernières semaines ? Sommes-nous plus efficaces dans la détections des cas "contacts" ? Ou est-ce simplement qu'une hausse du nombre de cas induit une hausse du nombre de test due à la recherche des cas contact ?

    Enfin, une piste, une moyenne glissante sur 7 jours aurait un intérêt pour afficher une tendance. Et juste à l'œil, on dirait que le nombre d'entrées en réanimation augmente.

    Bref, je pense qu'il y a des raisons de dire que la situation est moins favorable qu'ils y a un mois.

    • [^] # Re: Attention au retard !

      Posté par  (site web personnel, Mastodon) . Évalué à 6. Dernière modification le 25 juillet 2020 à 09:23.

      Et juste à l'œil, on dirait que le nombre d'entrées en réanimation augmente.

      Justement non. Mais ça ne diminue plus et c'est ça (aussi) qui inquiète, visiblement.

      D'une manière générale, le but de la démarche était de me faire une opinion moi-même, à partir d'une réflexion et d'une démarche personnelle, scientifique - ou en tout cas mesurable - et indépendante.

      Je la partage ici dans une démarche de confrontation et pour que chacun puisse l'améliorer avec sa perspective et ses idées, pas pour dire : "en réalité la situation est xxx".

      #tracim pour la collaboration d'équipe __ #galae pour la messagerie email __ dirigeant @ algoo

    • [^] # Re: Attention au retard !

      Posté par  (site web personnel) . Évalué à 9. Dernière modification le 25 juillet 2020 à 09:28.

      Pour moi, l’une majeure parmi ces raisons, c’est simplement les modélisations basiques de dynamique des épidémies amplement discutés sur Linuxfr. À partir de ces modèles — certes simplistes — on sait que l’épidémie repartira ; même si un soupçon d’empirisme plus avancé fait dire aux épidémiologistes que la virulence de la maladie devrait décroître avec le temps.
      Une autre raison de prévoir une résurgence plus brutale que nécessaire, c’est le grand chassé croisé des vacances. Élément essentiel d’une économie qui a perdu toute raison autre qu’elle même et donc dûment encouragé par les puissances financières. Voilà de quoi bien homogénéiser la répartition des foyers épidémiques.
      Conclusion, quoi qu’en dise l’empirisme, restons extrêmement prudents et hygiéniques ; l’épidémie devrait repartir si ce n’est déjà fait. Quitte à avoir la bonne surprise — quoi qu’improbable — d’une fin précoce de l’épidémie.

      « IRAFURORBREVISESTANIMUMREGEQUINISIPARETIMPERAT » — Odes — Horace

      • [^] # Re: Attention au retard !

        Posté par  . Évalué à 5. Dernière modification le 25 juillet 2020 à 09:37.

        Si le virus a une tendance saisonnière, on a une bonne certitude de le retrouver cet hiver, vu les données en Nouvelle-Zélande, pays au climat similaire au notre, mais décalé de 6 mois : là-bas c'est l'hiver et ça repart…

        "La liberté est à l'homme ce que les ailes sont à l'oiseau" Jean-Pierre Rosnay

        • [^] # Re: Attention au retard !

          Posté par  . Évalué à 3. Dernière modification le 25 juillet 2020 à 10:05.

          Je pense que la conception saisonnière n'est pas franchement justifiée et est basée sur un présupposé (et peut-être aussi sur un vœu pieux et un désir de rassurer de la part de l'État quand la crise faisait rage, et qu'on était en sortie d'hiver) . En Guyane, à Mayotte, dans le nord du Brésil, dans le sud des États-Unis, il n'y a pas de saison marquée (pas au niveau de la température, en tout cas), et le virus y est toujours particulièrement… virulent (et même plus que toutes les autres régions où il y a un hiver marqué).

          • [^] # Re: Attention au retard !

            Posté par  (Mastodon) . Évalué à 3.

            Je pense que lorsqu'on parle de saisonnalité il convient de ne parler que de cela.
            C'est à dire pas de "ça repart ici ou là" d'analyse des chiffres de contagions. Ce n'est pas nécessaire ici.
            Le virus est présent et actif. Partout. Quelques soient les conditions climatiques actuelle du pays regardé. Point.

            La saisonnalité ne repose donc plus que sur des paramètres secondaires : durée de vie réduit en dehors des hôtes par temps chaud et ensoleillé, etc .. (à contrario une potentielle plus forte activité par temps froid ?) Mais ce virus n'est pas un virus saisonnier. Non ? Qu'en pensez vous ?

            • [^] # Re: Attention au retard !

              Posté par  . Évalué à 5.

              Cet été, il est aisé aux familles et amis de se rencontrer en extérieur, et cela aussi est un paramètre saisonnier qui atténue probablement largement la contagiosité.

          • [^] # Re: Attention au retard !

            Posté par  . Évalué à 1.

            Je pense

            Excuse-moi mais on s'en fout. Je n'ai fait que reprendre ce que disent des spécialistes.

            D'autre part la saisonnalité de certains virus est une caractéristique de quelques écosystèmes, pas du monde entier. C'est le cas en Fance métropolitaine et en Nouvelle-Zélande de façon remarquablement similaire (c'est en les comparant qu'on prévoit la virulence de la grippe). Les épidémiologistes s'attendent à un retour saisonnier probable de l'épidémie à Coronavirus dans ces pays, puisque ça se passe généralement comme ça.

            "La liberté est à l'homme ce que les ailes sont à l'oiseau" Jean-Pierre Rosnay

            • [^] # Re: Attention au retard !

              Posté par  . Évalué à 4. Dernière modification le 25 juillet 2020 à 11:52.

              Je n'ai fait que reprendre ce que disent des spécialistes.

              (référence nécessaire)

              D'autre part la saisonnalité de certains virus est une caractéristique de quelques écosystèmes, pas du monde entier.

              (référence nécessaire)

              Tu opposes à un "je pense" que tu estimes hors propos des affirmations basées sur des arguments d'autorité non circonstanciés. Je continue à penser la même chose, d'autant plus que même si tu fournissais des références, tu ne prouverais pas ton point de vue, à moins que ces références ne portassent précisément sur le SARS-Cov19 :

              la saisonnalité de certains virus

              lesquels ? Des coronavirus également ? Si oui, a-t-on la certitude qu'ils agissent de la même manière dans le corps ? Quand j'ai entendu parler de saisonnalité, en mars, c'était surtout en référence à la grippe, qui n'est pas un corona-virus.

              J'ai mème entendu des gens dire à cette époque (en mars) que le Brésil serait faiblement atteint vu qu'il n'y a pas d'hiver sur grande part de son territoire (ça ferait sourire si ça n'était pas aussi triste).

              pas du monde entier

              … et pourquoi donc ? Qu'est-ce qui diffère d'une région à une autre, quels sont les critères scientifiques pour classer chaque région en regard à la saisonnalité des [corona-]virus ?

              Quand à la NZ, tu compares deux pays absolument non comparables, tu cherches à mettre en rapport les chiffres dans un pays où il y a 22 décès et une contagion rampante avec ceux de la France où il y a plus de 30.000 décès et où il y a une contagion chronique beaucoup plus élevée. Les pourcentages ne veulent rien dire sur des échantillons aussi différents ; de plus, appliquer des statistiques sur des petits nombres est trompeur.

              Donc, au finish, toi aussi "tu penses que…", jusqu'à plus ample développement, en tout cas.

              • [^] # Re: Attention au retard !

                Posté par  . Évalué à 0.

                Je ne compare aucun chiffre, aucun pays, je rapporte ce qu'ont dit et observé les épidémiologistes (d'après mes notes). Le pourquoi, on est loin de le comprendre, on observe que ça se passe comme ça, c'est tout.

                Prends la mouche si tu veux, mais discuter de ce qui est ou non une opinion ne m'intéresse pas et je n'en ai de toute façon pas le temps.

                "La liberté est à l'homme ce que les ailes sont à l'oiseau" Jean-Pierre Rosnay

        • [^] # Re: Attention au retard !

          Posté par  (Mastodon) . Évalué à 3.

          là-bas c'est l'hiver et ça repart…

          ça repart mais il faut prendre en compte qu'ils avaient réussi à atteindre et maintenir le 0 cas pendant quelques semaines. Et si on regarde les quelques semaines depuis qu'il y a de nouveaux cas, il n'y a pas de montée en flèche des contagions comme au mois de mars, donc c'est à confirmer sur la durée d'un mois. Il est de toute manière illusoire de s'imaginer que le virus disparaitra complètement comme le Sras par des mesures analogues.

          Je crois que la situation d'une île nation est de toute façon bien différente car il y a moins de points d'entrées à controller, il est possible de fermer les frontières réellement.

        • [^] # Re: Attention au retard !

          Posté par  (site web personnel) . Évalué à 4.

          Oui, c'est aussi ce que dit Arnaud Fontanet, épidémiologiste à l'Institut Pasteur, membre du conseil scientifique sur le Covid-19 par exemple
          https://www.franceinter.fr/emissions/l-invite-de-8h20-le-grand-entretien/l-invite-de-8h20-le-grand-entretien-06-juillet-2020

  • # ailleurs...

    Posté par  . Évalué à 5.

    La plupart de tes graphiques sont sur https://covid19.cartosport.com/ C'est interactif, on peut limiter à un département, naviguer sur les dates, etc.
    Pour une dissection plus large des données, Our World in Data a une section dédiée à l'épidémie, on peut y comparer pays et continent, suivre l'évolution du nombre de tests, lire une critique méthodologique, lire avec différentes moyennes, etc.

    "La liberté est à l'homme ce que les ailes sont à l'oiseau" Jean-Pierre Rosnay

    • [^] # Re: ailleurs...

      Posté par  (site web personnel, Mastodon) . Évalué à 7.

      Mon idée était bien de refaire les graphiques que l'on peut voir partout, et de savoir et comprendre comment ils étaient construits.

      #tracim pour la collaboration d'équipe __ #galae pour la messagerie email __ dirigeant @ algoo

  • # Région et France

    Posté par  . Évalué à 8.

    Je pense que le principal problème de cette analyse est qu'elle est fait de façon globale. La France est un pays assez grand où il y a des DOM/TOM. Un virus se transmet de façon très localisée. Au moment du confinement certaines régions notamment à l'ouest n'étaient pas touchées.
    Il y a une semaine je connais quelqu'un qui est allé à l'hôpital de Brest pour une toute autre raison (bras cassé) n'a pas pu être pris en charge. Donc localement il y a déjà rebond.

    Si on regarde à l'étranger, par exemple en Belgique. Un pays déjà plus proche d'une région. La deuxième vague est déjà en cours.

  • # Bilan et projection

    Posté par  (Mastodon) . Évalué à 7. Dernière modification le 25 juillet 2020 à 10:55.

    Merci pour cette analyse et son partage.

    Pour pouvoir faire plus qu'un bilan, donc faire une projection, il faut nécessairement injecter des estimations voir de simples idées. Et là nous ne sommes plus du tout dans l'analyse factuelle, chiffrée et vérifiable (dans ce contexte particulier, dans d'autres c'est jouable avec certitude bien sûr). Seul le R0 est une donnée s'approchant d'un fait qui permette une projection.
    C'est normal de ne voir que ce type d'analyse dans les médias, cela sera un peu osé de faire des projections. C'est normal de lire peu d'hypothèses par des infectiologues, cela pourrait être source de confusion pour le public (et en plus, avec l'ambiance ressentie actuelle sur les médias sociaux, ils seront nombreux à critiquer à postériori s'il manquait une virgule dans une hypothèse prédictive) Cependant rien n'empêche de se faire soi-même cette analyse, qui n'est pas de l'infectiologie et ne relève que de la logique.

    Type d'éléments indispensables à une projection et sans chiffres, juste des idées :

    • rassemblements publics nombreux : restaurants, bars, salles de sports, .. dans lesquels les mesures préventives ne sont pas appliquées.
    • population rencontrée en majorité dans ces espaces recevant du public

    Il s'agit donc ici de mouvements de population, de flux.
    On comprend bien que la jeunesse est le public majoritaire de ces espaces. Or on sait que c'est dans cette population que l'on trouve le plus de porteurs sains (asymptomatiques ou à faibles symptômes.)

    • dimension sociale, en majorité il s'agit de famille rassemblant au moins deux tranches d'âges distinctes.

    Le virus ayant pu circuler dans les bars et restaurants de manière plus importante, cela augmente le nombre de personnes porteuses souvent à faibles symptômes, qui elles-mêmes retournent chez elles. Au contact de gens d'une autre tranche d'âge.

    Donc en résumé : cette situation diffère de celle d'avant le confinement, nous sommes maintenant, et depuis 3 semaines, dans une situation où le nombre de cas asymptomatiques ou à faibles symptômes augmente très probablement en premier.

    Voilà.

    Il faut du coup s'abstenir d'essayer de chiffrer ça, cela deviendrait pifométrique, restons donc dans la seule logique.
    Au final, cela met en exergue le besoin d'analyse de la circulation virale, donc de la circulation et des inter-actions humaines, éléments centraux permettant d'anticiper (et pas seulement d'analyser)

    Pourtant des chiffres existent : dans les clusters identifiés où les actions de traçage ont été lancées et des tests pcr fait sur tout les contacts. "Nous" avons là des éléments qui permettent de consolider ce qui n'est que de la logique par des chiffres fiables : âge et état de santé de chaque personne dépistée positive, et leurs vies/habitudes sociales.
    Mais ces chiffres et stats ne semblent pas publiques, pas publiées du moins. Ils existent cependant, et permettent de faire une meilleure analyse projective, d'anticipation.

    Conclusion : si les autorités sanitaires disent qu'il y a un risque réel de voir repartir à la hausse le nombre de cas, il faut leur faire confiance. Même si ce résumé semble bien vague et même si le bilan non-projectif est bien rassurant.
    ( à la marge on peut aussi comprendre la difficulté de la communication)

    • [^] # Re: Bilan et projection

      Posté par  . Évalué à 4.

      Pour la tranche d'âge, c'est une donnée accessible. On remarque que c'erst surtout la tranche 15-44ans qui est porteuse, ce qui tend dans le même sens que ton analyse logique.

      Pour les cas plus graves, on aura donc probablement un décalage de 3 semaines, à voir. Mais c'est dès les premiers signes qu'ils faut réagir (masques, rappels des bons gestes, télétravail…), au pire on prend trop de précautions et c'est pas bien grave.

    • [^] # Re: Bilan et projection

      Posté par  . Évalué à 4.

      On pourrait ajouter encore pas mal de choses. Par exemple il y a beaucoup de diffusion sur la côte atlantique dûe aux vacanciers de la région parisienne, les clusters sont très localisés et de toute petite taille, les tests PCR sont-ils différenciés des tests sérologiques ? quelle est leur répartition géographique ? à Marseilles ils ont beaucoup de cas importés, le virus génère-t-il autant de cas grave ? etc. Tout ça rend effectivement l'analyse difficile. C'est le métier des épidémiologistes, pas le nôtre.

      "La liberté est à l'homme ce que les ailes sont à l'oiseau" Jean-Pierre Rosnay

      • [^] # Re: Bilan et projection

        Posté par  (site web personnel, Mastodon) . Évalué à 0.

        Pourquoi serait-ce forcément dû aux Franciliens ? Ce ne sont pas les seuls à prendre leurs vacances en Bretagne.

        « Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.

        • [^] # Re: Bilan et projection

          Posté par  . Évalué à 2.

          Un peu de sérieux quand même… Quelle région est plus pourrie que la Bretagne ?

          • [^] # Re: Bilan et projection

            Posté par  . Évalué à 6.

            Paris ?

            "La liberté est à l'homme ce que les ailes sont à l'oiseau" Jean-Pierre Rosnay

        • [^] # Re: Bilan et projection

          Posté par  . Évalué à 4.

          Il n'y a pas que la Bretagne sur la côte atlantique :-)

          "La liberté est à l'homme ce que les ailes sont à l'oiseau" Jean-Pierre Rosnay

  • # Plus ou moins les même type de graphs mais pour tous les pays du monde

    Posté par  . Évalué à 3.

    https://coronavirus.politologue.com/

    Voila, comme ça vous pourrez voir qu'effectivement ça repart un peu partout dans le monde. La France n'en est qu'au tout début mais nos stats sont de toutes façons assez niquées. D'un jour à l'autre, on retrouve des gens qui sont revenus d'entre les morts dans les fichiers de l'INSEE…

    La majeure partie des morts l'était déjà de son vivant et le jour venu, ils n'ont pas senti la différence.

  • # Bug nombre de tests ?

    Posté par  . Évalué à 4.

    J'avoue que je bug sur ton graphique recensant le nb de tests et le nb de tests positifs.
    Je ne comprends pas pourquoi en mai tu peux avoir plus de tests positifs que de tests. Ils sont au pire égaux (tous les gens testés sont positifs).

    • [^] # Re: Bug nombre de tests ?

      Posté par  . Évalué à 6.

      C'est une question d'échelle ;)

      https://linuxfr.org/users/barmic/journaux/y-en-a-marre-de-ce-gros-troll

      • [^] # Re: Bug nombre de tests ?

        Posté par  . Évalué à 3.

        C'est parce qu'au début ils ont utilisé des tests Lucky Luke, qui donnent le résultat plus vite que… :p

      • [^] # Re: Bug nombre de tests ?

        Posté par  . Évalué à 3.

        Oui, c'est évident maintenant. Marrant comment mon cerveau n'a pas vu la double échelle.

        • [^] # Re: Bug nombre de tests ?

          Posté par  (site web personnel, Mastodon) . Évalué à 6.

          Moi aussi avant de publier je me suis dit qu'il y avait un problème. Pourtant j'avais activé la double échelle cinq minutes avant :-p

          #tracim pour la collaboration d'équipe __ #galae pour la messagerie email __ dirigeant @ algoo

  • # ni code ni base de données

    Posté par  . Évalué à 6.

    Je vous laisse le choix des armes :

    Calc a tout ce qu'il faut pour le faire, il suffit d'utiliser la fonction SOMME.SI() avec un critère sur la date. Cela permet de construire une table réduite avec, pour chaque jour, la somme des données de tous les départements.

    Pour le jeu de données sur les tests, on peut tracer directement le graphique si on a auparavant filtré sur la classe d'âge en ne gardant que la classe 0.

    Sur ce graphique, si on ajoute une courbe de tendance polynomiale (j'ai pris degré 3) à la série des tests positifs, on voit bien une tendance à la hausse des contaminations depuis la mi juin.

    • [^] # Re: ni code ni base de données

      Posté par  (site web personnel, Mastodon) . Évalué à 3.

      Je ne connaissais pas cette fonction. Merci, je vais essayer :)

      #tracim pour la collaboration d'équipe __ #galae pour la messagerie email __ dirigeant @ algoo

    • [^] # Re: ni code ni base de données

      Posté par  . Évalué à 2.

      On peut aussi faire un somme.si() multi-critères en utilisant sommeprod().

      • département voulu en J4
      • date début en J5
      • date fin en J6
      • somme "incid_dc": =SOMMEPROD(A:A=J4;B:B>=J5;B:B<=J6;E:E)

      Les vrais naviguent en -42

  • # "faire confiance aveuglément" vs. "me faire une fausse idée en faisant une analyse simpliste"

    Posté par  . Évalué à 4.

    Attention avec le "ratio tests positifs": je ne pense pas qu'on puisse dire qu'à situation égale, ce ratio reste le même lorsqu'on augmente les tests, car les tests s'adressent en priorité aux personnes à risque. En d'autres termes, plus on fait de tests, plus on introduit dans l'équation des personnes ayant une plus grande probabilité de ne pas être positifs.

    Tu dis que tu préfères tester toi-même plutôt que "faire confiance aveuglément", mais la question se pose: peut-être que la confiance aveugle est moins risquée que de te faire une opinion en faisant des calculs pour lesquels tu n'as aucune expertise.
    L'exercise est d'autant plus périlleux que tu n'es pas en mesure de décider toi-même si tu es compétent dans le domaine ou non (effet Dunning-Kruger).

    • [^] # Re: "faire confiance aveuglément" vs. "me faire une fausse idée en faisant une analyse simpliste"

      Posté par  (site web personnel) . Évalué à 6.

      Cela dépend si le but est de comprendre / par curiosité, ou bien de se faire une opinion. Par exemple tu peux trouver une corrélation inverse avec la longueur des cheveux ou des vêtements portés, ou faire une erreur de calcul / méthode, ou négliger un paramètre important, etc. Si tu décides de demander/chercher des explications auprès de personnes plus expérimentées dans le domaine, ou si tu publies sur ton blog/réseau social préféré 'la vérité sur la covid et son traitement par la coupe des cheveux et des vêtements', c'est très différent. Ça créé cependant un biais qui est que si tu trouves quelque chose qui correspond à ce que les spécialistes disent, tu penses avoir bien calculé (même si ce n'est pas le cas). Si tu trouves autre chose, soit tu continues à chercher, soit tu penses être un génie ignoré ou que le reste du monde te ment (à toi, personnellement, monde de merde).

      Dans une optique d'éducation populaire, ça me semble plutôt bien d'avoir des gens qui cherchent à comprendre.

      • [^] # Re: "faire confiance aveuglément" vs. "me faire une fausse idée en faisant une analyse simpliste"

        Posté par  . Évalué à 1.

        Oui, je suis totalement d'accord avec ça. Et j'adore ce genre de petit exercice pour s'amuser avec les données.

        Ma réaction est sur tout l'aspect "Peut-on faire confiance aux experts? Je ne sais pas, alors, je vais faire 2-3 additions et divisions, lancer le sujet sur un forum, et dans 2 semaines, je pourrais dire si le gouvernement me ment ou pas".

        Cela ne veut pas dire que le gouvernement ne ment pas. Simplement que ce n'est pas comme ça qu'on va pouvoir prouver quoi que ce soit.

        Et si j'ai réagi, c'est parce que ce genre d'erreur de ce genre arrive malheureusement souvent.

    • [^] # Re: "faire confiance aveuglément" vs. "me faire une fausse idée en faisant une analyse simpliste"

      Posté par  (site web personnel, Mastodon) . Évalué à 4.

      Tu dis que tu préfères tester toi-même plutôt que "faire confiance aveuglément", mais la question se pose: peut-être que la confiance aveugle est moins risquée que de te faire une opinion en faisant des calculs pour lesquels tu n'as aucune expertise.

      La question ne se pose pas à mon avis : j'ai une culture et un parcours scientifique qui me permettent d'arriver à reproduire les résultats "mathématiques" montrés par ceux qu'on présente comme experts". Faire confiance aveuglément sous prétexte que c'est le gouvernement qui l'a dit, c'est le parti unique : faites confiance au dictateur bienfaisant.

      L'esprit critique est la base d'un système le plus proche de la vérité possible, il me semble.

      L'exercise est d'autant plus périlleux que tu n'es pas en mesure de décider toi-même si tu es compétent dans le domaine ou non (effet Dunning-Kruger).

      Je n'ai pas tiré de conclusion sur les résultats de mon travail - comme tu le dis je ne suis pas expert du domaine. Mais le domaine comporte un travail de mathématiques et/ou statistiques et un travail d'interprétation. J'ai un parcours qui me permet de reproduire la première partie mais pas la seconde.

      Par ailleurs, le fait de publier ce journal et de récolter les réactions fait partie de ma démarche. Confronter mes travaux aux remarques et réactions de personnes plus compétentes que moi (mais n'étant pas non plus expertes du domaine) est important, le fait de dérouler ma démarche seul et ensuite de la confronter à d'autres analyses similaires est également un aspect clé du travail.

      Par exemple, comment calcule-t-on qu'une épidémie repart ? Nombre de cas à la hausse ? Augmentation de la vitesse d'apparition de nouveaux cas ? Prise en compte globale ? Locale ? Quelle incidence de la tranche d'âge ?

      Si tu n'as pas réfléchi au sujet tu n'en sais rien. Si tu y réfléchis en diagonal "ça paraît facile". C'est d'ailleurs ce que j'avais fait dans un premier temps en suivant la presse et les médias. Et puis ensuite, quand tu prends le temps d'extraire des informations, de faire des calculs, d'améliorer ta représentation / modélisation, tu te rends naturellement compte de la limite de tes connaissances. Et des commentaires à mon journal sont là pour me le rappeler, mais aussi pour enrichir ma réflexion en partageant des liens, des analyses trouvées ailleurs.

      Je ne crois pas donner de conclusion dans mon journal et pour cause : au moment de le publier, j'étais déçu car je n'avais pas réussi à étayer mon intuition, ni à la contredire d'ailleurs. Ça n'est plus le cas aujourd'hui ; ce n'est pas le fruit de mon analyse mais le fruit de ma démarche de chercher à comprendre et de valider/invalider ce que j'ai pu lire ici et là et d'être vraiment confronté au sujet.

      #tracim pour la collaboration d'équipe __ #galae pour la messagerie email __ dirigeant @ algoo

      • [^] # Re: "faire confiance aveuglément" vs. "me faire une fausse idée en faisant une analyse simpliste"

        Posté par  . Évalué à 5.

        La question ne se pose pas à mon avis : j'ai une culture et un parcours scientifique qui me permettent d'arriver à reproduire les résultats "mathématiques" montrés par ceux qu'on présente comme experts". Faire confiance aveuglément sous prétexte que c'est le gouvernement qui l'a dit, c'est le parti unique : faites confiance au dictateur bienfaisant.

        Sauf que dans juste cet article, je vois au moins trois endroits où tu as faits des erreurs que ces experts n'auront pas faites.

        En gros, tu penses reproduire les résultats mathématiques, mais tu ne suis pas leur méthodologie (honnêtement, tu as juste fait des additions et des divisions. Tu penses vraiment que les experts passent des jours pour obtenir un résultat aussi facile à obtenir, et n'utilisent pas de simulations bien plus complexes, impliquant la géographie, la densité de population, le taux de faux positifs et négatifs des tests, le modeling de la courbe d'incubation, …).
        Donc, tu vas obtenir des résultats qui peuvent conduire à des conclusions différentes, et en déduire que "les experts se trompent". Sauf que tu ne sais pas si les experts se trompent ou si c'est toi qui te trompes.

        Pour une reprise des contaminations, il y a fort à parier que la conclusion se base sur un modèle probabiliste (et non ponctuel comme le tien) qui va calculer le degré de confiance des modèles impliquant une reprise par rapport aux modèles impliquant pas de reprises mais uniquement des fluctuations statistiques.

        j'ai une culture et un parcours scientifique

        Si tu avais réellement une culture scientifique, tu saurais que ton analyse est réellement très simpliste, et que tu es passé à côté de tas de considérations importantes que toi et moi n'avons pas vues simplement parce que nous n'avons pas travaillé sur le sujet durant plusieurs années.

        Alors, oui, tu as un parcours scientifique. Mais ce parcours scientifique te biaise: tu penses qu'il t'aide à reproduire plus facilement les résultats, alors qu'en réalité, il te cache le fait qu'entre toi et les experts, il y a autant de différence qu'entre toi et un enfant de 10 ans (ce n'est pas une exagération, c'est réellement l'ordre de grandeur quand quelqu'un a 5-10 ans d'expérience de plus que toi sur un sujet scientifique sur lequel tu n'es pas spécialisé).

        Je n'ai pas tiré de conclusion sur les résultats de mon travail

        Donc, tu expliques que c'est important de reproduire les résultats au lieu de "faire confiance aveuglément", tout en ne reproduisant PAS les résultats (non, les calculs que tu as fait ne sont PAS les calculs faits par les experts qui leur permettent de dire si ça repart ou pas), et en disant que reproduire les résulats ne permet pas de savoir si les experts ont raison ou non.

        Que les choses soient clairs: si tu avais dit "je veux m'amuser avec les chiffres", j'aurais rien eu à redire, et j'aurais même applaudi et participé.
        Mais là, tu présentes la chose en disant "ne pas faire une confiance absolue aux experts" (et tu le fais dans le commentaire ci-dessus avec la question du dictateur). Sauf que à ton niveau, faire confiance absolue aux experts est sans doute bien moins risqué que de "reproduire les résultats" par toi-même, surtout si tu sembles ne même pas te rendre compte que les experts ne font pas ce genre de calculs.

        Tu ne fais pas confiance au gouvernement. Bien. Ça tombe bien, moi non plus. Mais tes petites divisions sont du niveau d'un exercise de première année, alors que les experts sont du niveau d'un doctorat. C'est illusoire de prétendre que tu vas nous sauver d'un méchant dictateur quand ta méthodologie ne peut pas démontré que le message du gouvernement est correct ou incorrect.

        • [^] # Re: "faire confiance aveuglément" vs. "me faire une fausse idée en faisant une analyse simpliste"

          Posté par  (site web personnel, Mastodon) . Évalué à 3.

          Je vois ce que tu veux dire.

          Ce journal a le mérite d'avoir permis à des gens de partager des liens vers des documents et outils intéressants.

          Je t'invite également à partager tes connaissances et à m'expliquer où sont les (au moins) trois erreurs de raisonnement que j'ai faites. Ça grandira tous ceux qui ne les ont pas vues.

          Sauf que à ton niveau, faire confiance absolue aux experts est sans doute bien moins risqué que de "reproduire les résultats" par toi-même

          Je n'ai pas bien compris quel risque je cours à tracer quelques graphes et voir si je reproduis ce que je vois dans les médias… me tromper ? C'est pas très grave, si ?

          #tracim pour la collaboration d'équipe __ #galae pour la messagerie email __ dirigeant @ algoo

          • [^] # Re: "faire confiance aveuglément" vs. "me faire une fausse idée en faisant une analyse simpliste"

            Posté par  . Évalué à 3. Dernière modification le 27 juillet 2020 à 21:00.

            Je t'invite également à partager tes connaissances

            La plus grande connaissance que je peux partager est: il y aujourd'hui un gros problème de personnes qui pensent pouvoir "vérifier" alors qu'ils n'ont pas les compétences, et cela pourrit le débat scientifique constructif.

            m'expliquer où sont les (au moins) trois erreurs de raisonnement

            Pour les trois erreurs que j'ai relevées:
            - supposer que le ratio entre le nombre de tests et le nombre de tests positifs peut indiquer un redémarrage
            - supposer que le taux de décés, réanimation ou hospitalisation peut montrer un redémarrage dans les premières semaines de celui-ci
            - supposer que le redémarrage est visible dans les données intégrées sans regarder au niveau local
            Que ce soit clair: ce ne sont pas des graves erreurs, mais je doute qu'un expert ne voit pas ça comme trivial.

            Je n'ai pas bien compris quel risque je cours à tracer quelques graphes et voir si je reproduis ce que je vois dans les médias… me tromper ? C'est pas très grave, si ?

            Si tu ne fais que t'amuser avec les données, ce n'est pas grave, non.
            Mais si tu ajoutes à ça un discours sur le fait qu'il vaut mieux vérifier par soi-même alors qu'on n'est pas qualifié, cela participe à la création d'une mentalité qui nourrit les climato-sceptiques et consorts.

            Après, pour la question de la gravité: toi soutenant une mauvaise solution au point qu'elle soit appliquée est tout aussi grave moralement que le méchant gouvernement soutenant une mauvaise solution au point qu'elle soit appliquée. (et ne viens pas me dire que "oui mais ma solution n'est jamais appliquée parce que le méchant gouvernement ne veut pas": lorsque tu soutiens cette solution, tu souhaites qu'elle soit appliquée et tu critiques le gouvernement pour ne pas le faire. Tu ne peux pas blamer certains pour faire exactement ce que tu souhaites faire toi-même si tu en avais la possibilité)

  • # panda

    Posté par  . Évalué à 5.

    Bonjour,

    si tu sais faire un peu de python tu devrais peut être jeter un œil à panda. Ça me simple bien plus simple.

    Titre de l'image

    Après le bon outil est l'outil qu'on maitrise.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.