Supprimer les contenus non publics datant de plus d'un an (et les étiquetages associés s'il y en a, et les commentaires associés s'il y en a)
Supprimer les commentaires non publics datant de plus d'un an
Supprimer les contenus non publics datant de plus d'un an (et les étiquetages associés s'il y en a, et les commentaires associés s'il y en a)
Supprimer les commentaires non publics datant de plus d'un an
# Contenus non publics
Posté par Benoît Sibaud (site web personnel) . Évalué à 3 (+0/-0). Dernière modification le 29 janvier 2023 à 20:18.
wiki_pages
, 139 denodes
, 139 defriendly_id_slugs
, 247 dewiki_versions
et 26 decomments
trackers
, 40 denodes
, 64 defriendly_id_slugs
et 10 decomments
polls
, 106 denodes
, 110 defriendly_id_slugs
, 662 depoll_answers
et 2 decomments
posts
, 894nodes
, 933friendly_id_slugs
, 382comments
diaries
, 171nodes
, 172friendly_id_slugs
, 1509comments
bookmarks
, 170nodes
, 170friendly_id_slugs
et 61comments
news
, 1627nodes
, 2250friendly_id_slugs
, 18509news_versions
, 15468paragraphs
, 1952links
[^] # Re: Contenus non publics
Posté par Gil Cot ✔ (site web personnel, Mastodon) . Évalué à 3 (+0/-0).
Ça mériterait un journal pour nous expliquer ce que sont ces contenus non publics (je ne pensais pas la chose possible) et les apports du nettoyage de quart de siècle.
“It is seldom that liberty of any kind is lost all at once.” ― David Hume
[^] # Re: Contenus non publics
Posté par Benoît Sibaud (site web personnel) . Évalué à 4 (+0/-0).
Chaque rétrospective de quinzaine (exemple) indique les commentaires et contenus masqués :
Les comptes non confirmés (validation du lien reçu par courriel) / jamais utilisés sont supprimés automatiquement.
Les comptes fermés le sont soit par les personnes ayant les comptes, soit par les admins (spam de très loin en premier, abus, illégalité manifeste, demande des personnes ayant les comptes, etc.). Ils restent en base.
Les contenus (dépêches, journaux, forums, sondages, pages wiki, suivi, liens) et les commentaires peuvent être masqués/dépubliés par les admins (spam, abus, illégalité manifeste, demande des personnes pour virer un doublon ou retirer un propos, purge de compte demandée, etc.). À part dans le cas de la purge, qui a lieu en base, les contenus et commentaires dépubliés restent en base.
Les étiquettes peuvent être masquées par les admins (mauvais nom, doublon, spam, etc.). Ces étiquettes restent en base.
L'opération de ce ticket consistait à supprimer ce qui était invisible sauf pour les admins, et qui avait plus d'un an, pour alléger la base, pour virer l'inutile. Pourquoi garder un an ? Pour avoir un peu de recul sur les spammeurs et les problèmes passés au besoin, pour republier au besoin ce qui aurait été dépublié par erreur / à tort, etc.
L'effacement automatique au bout d'un an de l'invisible serait à implémenter.
Et les questions plus compliquées/longues arrivent ensuite :
[^] # Re: Contenus non publics
Posté par Ysabeau 🧶 (site web personnel, Mastodon) . Évalué à 3 (+0/-0).
Et les comptes confirmés mais pas actifs ou plus actifs depuis un certain temps, ils sont supprimés aussi ?
« Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.
[^] # Re: Contenus non publics
Posté par Benoît Sibaud (site web personnel) . Évalué à 3 (+0/-0).
C'est ce que je décris dans mon dernière paragraphe notamment. Actuellement, non, rien n'est fait automagiquement.
[^] # Re: Contenus non publics
Posté par Ysabeau 🧶 (site web personnel, Mastodon) . Évalué à 4 (+0/-0).
Je n'avais pas percuté.
On pourrait dire dix ans par exemple pour les comptes inactifs. C'est le délai de prescription courant de pas mal de documents :-) qui fait qu'on doit virer des bases de données clients (donc commerciales), les clients qui n'ont pas été actifs (pour lesquels on n'a pas fait de facture). C'est un délai comme un autre. Mais on peut faire moins.
« Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.
[^] # Re: Contenus non publics
Posté par Benoît Sibaud (site web personnel) . Évalué à 4 (+0/-0).
10 ans c'est probablement trop long vu notre nécessité/besoin et ce que demande le RGPD. On n'a certes pas de données hypersensibles, mais pas grand chose ne justifie de les garder super longtemps non plus. Six ou sept ans serait un max a priori. Mais pour LinuxFr il faudrait plutôt choisir entre 1 an ou 3 ans ou 5 ans.
Mon idée serait de lancer une dépêche sous peu indiquant les changements envisagés, et de les appliquer à partir de la date anniversaire des 25 ans du site (fin juin donc), ce qui laisserait le temps aux gens qui le souhaitent de réagir, utiliser leur compte, fermer leur compte, etc.
[^] # Re: Contenus non publics
Posté par Ysabeau 🧶 (site web personnel, Mastodon) . Évalué à 4 (+0/-0).
Je penche pour trois ans, un an c'est peut-être un peu juste.
« Tak ne veut pas quʼon pense à lui, il veut quʼon pense », Terry Pratchett, Déraillé.
[^] # Re: Contenus non publics
Posté par Gil Cot ✔ (site web personnel, Mastodon) . Évalué à 2 (+0/-0).
Merci beaucoup pour ces réponses détaillées.
C'est passionnant (et pas mal chronophage non ?)
“It is seldom that liberty of any kind is lost all at once.” ― David Hume
[^] # Re: Contenus non publics
Posté par Benoît Sibaud (site web personnel) . Évalué à 3 (+0/-0).
Chronophage de répondre aux questions ? D'une part ça montre un intérêt, sur des tâches qui pourraient être faites dans l'indifférence complète, donc on ne va pas se plaindre d'avoir des questions :). C'est même plutôt bon pour la motivation je dirais. D'autre part ça aide à préparer la suite en réfléchissant au sujet et en mettant par écrit, pédagogiquement si possible. Plus d'autres aspects comme le fait de pouvoir partager avec d'autres personnes de l'équipe qui débuteraient ou connaîtraient moins le sujet, ou bien le fait que même tout seul je peux retrouver un vieux commentaire à moi et comprendre/redécouvrir ce que j'avais fait, quels étaient les chiffres de l'époque, etc.
# Commentaires non publics datant de plus d'un an
Posté par Benoît Sibaud (site web personnel) . Évalué à 3 (+0/-0).
Les titre et corps des commentaires de plus d'un an ont été purgés (ce qui ne change rien en apparence pour tous ceux qui ne sont pas dans l'administration du site, mais qui allège la base de données). 14338 commentaires concernés.
# Durée des optimisations de tables
Posté par Benoît Sibaud (site web personnel) . Évalué à 3 (+0/-0).
# Total ?
Posté par vmagnin (site web personnel) . Évalué à 3 (+0/-0).
Quel est le poids total du site en Gio ?
[^] # Re: Total ?
Posté par Benoît Sibaud (site web personnel) . Évalué à 5 (+0/-0).
(pour les contenus en base de données mariadb ou redis, hors fichiers d'images, caches, logs, etc)
avant le nettoyage :
après le nettoyage :
(8,9 GiB pour mariadb.dump hors compression gzip)
data_length + index_length : 12.85 GiB selon MariaDB
[^] # Re: Total ?
Posté par vmagnin (site web personnel) . Évalué à 3 (+0/-0).
Très raisonnable pour du 25 ans d'âge !
Envoyer un commentaire
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.