Suivi — Administration site Images et disparition du web

#3211 Posté par Benoît Sibaud (site web personnel) le 17 juillet 2024 à 11:45. État de l’entrée : ouverte. Licence CC By‑SA.

Étiquettes : aucune

juil.

2024

Une sorte de meta-entrée de suivi pour discuter des soucis sur les images (domaines récupérés par des spammeurs et autres pénibles, ou perdus ou utilisés pour du phishing) sont en augmentation (imageshack.us, après framapic, pix.toilelibre, etc.).

ça arrive de plus en plus en souvent et ce n'est pas prêt de s'arrêter. Que mettre en place techniquement pour gérer ça ?

Liste probablement non exhaustive d'entrées de suivi sur le sujet :

Références :

Problématiques :

perte d'info -> diminution de l'intérêt des contenus anciens
prime aux pénibles du référencement SEO qui pourrissent le net en récupérant les vieux domaines
modification des images publiées
stocker toutes les images amènent aussi son lot de contraintes (en vrac sans hiérarchisation) : responsabilité légale, volumétrie, impossibilité de corriger une image publiée facilement, centralisation/perte de référencement pour des tiers, etc.

Techniquement :

idéalement on ne devrait pas avoir d'images manquantes ou bloquées, mais ça nécessite de les suivre et d'intervenir de façon régulière
même en remplaçant le cache actuel pour un stockage pur et dur (que ça soit à la publication, au bout d'un certain temps après ou autre), il faudrait traiter l'historique
on ne peut pas juste traiter le cas des dépêches et journaux (tous les autres contenus/commentaires pouvant accueillir des images posent le même souci, et viendront mélanger leurs images manquantes ou bloquées avec les dépêches et journaux)
pour éviter la perte d'info, il est plus pertinent de remplacer par une image locale récupérée d'une archive du net type archive.org (côté pénible à faire et sans garantie que ça soit toujours possible)
faut-il différencier les images passées en modération a priori de celles en modération a posteriori ?

# Suggestion

Posté par devnewton 🍺 (site web personnel) le 09 août 2024 à 09:15. Évalué à 4 (+0/-0).
Pour limiter le volume et les problèmes juridiques:
- chaque image serait associée à l'utilisateur qui l'a uploadé ;
- seuls les utilisateurs avec un bon karma auront accès à la fonction d'upload ;
- chaque image doit avoir une licence libre et un auteur (champs obligatoires à remplir).
Pour le coût du stockage et du dev, ce serait l'occasion d'une campagne de financement participatif?

Le post ci-dessus est une grosse connerie, ne le lisez pas sérieusement.
Répondre
# Et les sites?

Posté par octane le 09 août 2024 à 09:58. Évalué à 2 (+0/-0).

Je constate le même problème pour les liens. Quantité de blogs/sites/aggrégateurs ont disparus.
Faire des recherches anciennes sur le web c'est passer son temps à tomber sur des 404, ou des DNS qui n'existent plus.

On pourrait imaginer crawler tous les liens régulièrement voir s'ils sont actifs, mais certains sites renvoient systématiquement un code 200 même quand la page n'existe pas.

Répondre
- [^] # Re: Et les sites?
  
  Posté par Benoît Sibaud (site web personnel) le 09 août 2024 à 11:47. Évalué à 4 (+0/-0).
  
  Voir https://linuxfr.org/suivi/hyperliens-et-disparition-du-web dédié au sujet
  
  Répondre
# voire aussi

Posté par Krunch (site web personnel) le 09 août 2024 à 14:15. Évalué à 3 (+0/-0).

https://linuxfr.org/suivi/heberger-les-images-des-news-et-eventuellement-journal

pertinent adj. Approprié : qui se rapporte exactement à ce dont il est question.

Répondre