Une sorte de meta-entrée de suivi pour discuter des soucis sur les images (domaines récupérés par des spammeurs et autres pénibles, ou perdus ou utilisés pour du phishing) sont en augmentation (imageshack.us, après framapic, pix.toilelibre, etc.).
ça arrive de plus en plus en souvent et ce n'est pas prêt de s'arrêter. Que mettre en place techniquement pour gérer ça ?
Liste probablement non exhaustive d'entrées de suivi sur le sujet :
- Images (hébergées sur imageshack) non visibles sur une entrée de 2012
- Framapic
- Héberger les images des news (et éventuellement journal)
Références :
- article Next 38 % des pages web de 2013 n’étaient plus accessibles fin 2023
- waybackpy
- Hyperliens et disparition du web
Problématiques :
- perte d'info -> diminution de l'intérêt des contenus anciens
- prime aux pénibles du référencement SEO qui pourrissent le net en récupérant les vieux domaines
- modification des images publiées
- stocker toutes les images amènent aussi son lot de contraintes (en vrac sans hiérarchisation) : responsabilité légale, volumétrie, impossibilité de corriger une image publiée facilement, centralisation/perte de référencement pour des tiers, etc.
Techniquement :
- idéalement on ne devrait pas avoir d'images manquantes ou bloquées, mais ça nécessite de les suivre et d'intervenir de façon régulière
- même en remplaçant le cache actuel pour un stockage pur et dur (que ça soit à la publication, au bout d'un certain temps après ou autre), il faudrait traiter l'historique
- on ne peut pas juste traiter le cas des dépêches et journaux (tous les autres contenus/commentaires pouvant accueillir des images posent le même souci, et viendront mélanger leurs images manquantes ou bloquées avec les dépêches et journaux)
- pour éviter la perte d'info, il est plus pertinent de remplacer par une image locale récupérée d'une archive du net type archive.org (côté pénible à faire et sans garantie que ça soit toujours possible)
- faut-il différencier les images passées en modération a priori de celles en modération a posteriori ?
# Suggestion
Posté par devnewton 🍺 (site web personnel) . Évalué à 4 (+0/-0).
Pour limiter le volume et les problèmes juridiques:
Pour le coût du stockage et du dev, ce serait l'occasion d'une campagne de financement participatif?
Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.
# Et les sites?
Posté par octane . Évalué à 2 (+0/-0).
Je constate le même problème pour les liens. Quantité de blogs/sites/aggrégateurs ont disparus.
Faire des recherches anciennes sur le web c'est passer son temps à tomber sur des 404, ou des DNS qui n'existent plus.
On pourrait imaginer crawler tous les liens régulièrement voir s'ils sont actifs, mais certains sites renvoient systématiquement un code 200 même quand la page n'existe pas.
[^] # Re: Et les sites?
Posté par Benoît Sibaud (site web personnel) . Évalué à 4 (+1/-0).
Voir https://linuxfr.org/suivi/hyperliens-et-disparition-du-web dédié au sujet
# voire aussi
Posté par Krunch (site web personnel) . Évalué à 3 (+0/-0).
https://linuxfr.org/suivi/heberger-les-images-des-news-et-eventuellement-journal
pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.
Envoyer un commentaire
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.