Une sorte de meta-entrée de suivi pour discuter des soucis sur les liens (domaines récupérés par des spammeurs et autres pénibles, ou perdus ou utilisés pour du phishing) sont en augmentation (après mandriva, in libro veritas, oreilly fr, linux-france…).
ça arrive de plus en plus en souvent et ce n'est pas prêt de s'arrêter. Que mettre en place techniquement pour gérer ça ?
Liste probablement non exhaustive d'entrées de suivi sur le sujet :
- Retirer les liens goo gl
- Retirer les liens oreilly.fr
- Retirer les liens linux-france.org
- Retirer les liens inlibroveritas[.]net et ilv-store[.]com https://linuxfr.org/suivi/retirer-les-liens-inlibroveritas-net-et-ilv-store-com
- Retirer les liens mandriva[.]com
- Broken link
- Broken link
Références :
- Images et disparition du web
- article Next 38 % des pages web de 2013 n’étaient plus accessibles fin 2023
- waybackpy
- aide nofollow et noindex : https://linuxfr.org/suivi/nofollow-et-noindex
Problématiques :
- perte d'info et de référence -> diminution de l'intérêt des contenus anciens
- prime aux pénibles du référencement SEO qui pourrissent le net en récupérant les vieux domaines
- sites de spam et contenus illégaux/restreints qui seraient pointés (jeux en ligne, médicaments, porno, etc.)
- phishing
- aspect vicieux car l'ancien contenu peut être gardé en ligne mais légèrement modifié, ou le contenu servi peut être différent suivant l'IP source ou le navigateur par exemple
Techniquement :
- juste mettre un nofollow, noindex traite un peu le cas du SEO (même si ça ne les arrêtera pas les pénibles) mais il faudrait donc avoir une liste globale de domaines à gérer ainsi et que cela s'applique à tous les contenus et commentaires
- ça n'empêche pas notre lectorat de cliquer, donc ça ne règle pas les problématiques de phishing et autres aspects vicieux
- pour éviter la perte d'info, il est plus pertinent de remplacer par un lien avec une archive du net type archive.org (avec recentralisation au passage, et aussi le côté pénible à faire et sans garantie que ça soit toujours possible)
# .invalid
Posté par Benoît Sibaud (site web personnel) . Évalué à 5 (+2/-0).
Pour les domaines problématiques, une solution de repli (en l'absence de lien archive.org ou là où la volumétrie rend le changement difficile genre les commentaires) est d'ajouter un
.invalid
à la fin. Le lien reste casse mais pas de SEO, pas phishing et probablement pas de tentative si le navigateur fait son taf.# Goo.gl
Posté par nud . Évalué à 4 (+0/-0).
Il faut rajouter les liens goo.gl à la liste:
[^] # Re: Goo.gl
Posté par Benoît Sibaud (site web personnel) . Évalué à 6 (+3/-0).
C'est le problème avec les petites boîtes sans moyen, tout le monde ne peut pas avoir la force de frappe et la capacité infinie de LinuxFr.org.
Envoyer un commentaire
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.