Journal Des mauvais usages des nouvelles technologies...

Posté par  .
Étiquettes : aucune
0
17
fév.
2005
Le serveur rame cet après-midi, alors j'en profite pour faire un tour au royaume des statistiques...

Que trouve-t-on ?

Le 82.17.137.28, chez Free, a fait sur le site 2 visites en février (15 jours), et il a réussi à totaliser 1 681 792 hits.
L'adresse répond en SSH, donc c'est probablement un particulier (et pas un proxy d'entrerprise, j'entends)
Pas mal...
On pourrait penser à un aspirateur lancé à travers...
Non : si on corrèle ça avec les "navigateurs" :
1 687 579 hits pour le "navigateur" centericq : c'est un Instant Messenger, très probablement utilisé comme "news reader".

Le plus amusant, c'est qu'il n'y a pas eu de "pic" de connexions en février : le gus qui a lancé son ICQ sur linux.fr l'a laissé tourner depuis 15 jours...
Ca fait donc 100 000 hits par jour, soit 1 hit par seconde.
Chaque seconde, ce PC fait une requête pour récupérer le flux RSS de linuxfr.org
C'est du n'importe-quoi...

(hep, toi qui utilises centericq , tu me lis, hein ? tu peux le configurer stp ?)


ovh.net a lancé 734 931 requêtes en 44 visites. Bien aussi.
Je ne sais pas bien ce qu'est ovh.net. Donc je ne sais pas si un tel usage est pertinent...

Puis vient gaoland.net : 83 720 hits, en 167 visites en 15 jours : 10 visites par jour !
www.gaoland.net nécessite un mot de passe ; c'est probablement une petite société, voire un particulier.
Les personnes ont tout de même consommé 1.7 Go, soit 2% du total...
C'est du n'importe-quoi aussi.

Qu'en déduit-on ?
Que les gens font n'importe quoi avec leurs outils ; ou bien qu'ils ne savent pas les configurer. Mais une requête vers un flux RSS à chaque seconde, ce n'est pas une config par défaut. L'irresponsable a sans doute sciemment lancé ça en disant "tant que celà fonctionne, continuons." Et celui qui consomme à lui tout seul 2% du volume du site ferait bien aussi de réfléchir à l'utilité de ça.

Internet n'est pas gratuit : la bande passante coûte cher, le matériel aussi.
De telles requêtes, ça fait vraiment penser à un robinet ouvert : c'est complètement inutile, mais, au fond, tant que c'est individuel, tout le monde s'en fout ; mais si ce comportement se généralise, ce sera la catastrophe...
  • # Gaoland.net

    Posté par  . Évalué à 10.

    Je peux me tromper, mais je vois beaucoup (tout est relatif cependant) de gens sur irc qui resolvent en gaoland.net, donc je pense qu'il s'agit plutot d'un FAI...
    Un whois par exemple permet d'apprendre que c'est rattaché à LDCOM (donc à Neuf Telecom...). Que ca prenne 2% du volume du site me choque un peu moins du coup.
    • [^] # Re: Gaoland.net

      Posté par  . Évalué à 2.

      Je confirme que gaoland est bien lié à Neuf Télécom : j'ai bloqué le port ident de ma machine, donc pas de reverse-dns en neuf.fr, mais plutôt une adresse en gaoland.net, qui semblent être des serveurs "au-dessus".
      • [^] # Re: Gaoland.net

        Posté par  . Évalué à 6.

        ident / reverse dns ?
        il dit qu'il voit pas le rapport
    • [^] # Re: Gaoland.net

      Posté par  . Évalué à 2.

      Oui oui, je connais des personnes qui ont 9télécom comme FAI, et je les vois comme venant du domaine gaoland.net
  • # Des mauvais usages des nouvelles technologies...

    Posté par  . Évalué à 10.

    Je pense que c'est l'un des effets pervers de la généralisation de l'Adsl : (très) haut débit, temps de connexion illimité. Les gens qui n'ont jamais connu que ça (et ne sont pas passé pas la case RTC 56k et moins) ne s'en rendent pas compte.

    Reste maintenant à éduquer, comme pour la divulgation des adresse mail sur le net (excellent pour chopper des spams), les virus ...
  • # Humour....

    Posté par  . Évalué à 9.

    Chaque seconde, ce PC fait une requête pour récupérer le flux RSS de linuxfr.org
    C'est du n'importe-quoi...


    Tout à fait, surtout qu'avec la vitesse d'apparition des news sur DLFP, il à peu de chance d'en rater une, meme s'il ne récupère le RSS qu'une fois par moi...
    • [^] # Re: Humour....

      Posté par  . Évalué à 8.

      ah si ! pasque quand les news deboulent, c'est par paquets de 10 :D
      m'enfin, un flux rss rafraichi 2x/j et encore suffit tres tres largement

      Imbolcus
      A vot' service
    • [^] # Re: Humour....

      Posté par  . Évalué à 2.

      Tout à fait, surtout qu'avec la vitesse d'apparition des news sur DLFP, (...) dit celui qui, depuis 2 ans que son compte existe, n'a pas proposé une seule news publiée...
      • [^] # Re: Humour....

        Posté par  . Évalué à 5.

        Oui bah ça c'est aussi facile que ma réflexion hein.

        Et puis ce n'est pas ma faute, je suis utilisateur debian, j'attends que sarge passe en stable pour faire une news.
        Des fois je me dit que si je passais à Mandrake, ca serais plus facile, entre les Alpha/beta/ releases et les bugs dont on parle entre les release, y'a de quoi meubler a la fois les journaux et les news.

        Et puis de toute façon sur linuxfr, c'est pas le nombre de news publiés qui fait un homme, c'est les XP.

        Le titre du commentaire c'est toujours "Humour", on est bien d'accord...
  • # gaoland... + man whois

    Posté par  . Évalué à 9.

    Puis vient gaoland.net : 83 720 hits, en 167 visites en 15 jours : 10 visites par jour !

    Pas gaoland.net, mais un hôte de ce domaine.

    www.gaoland.net nécessite un mot de passe ; c'est probablement une petite société, voire un particulier.

    Oui une petite société ou un particulier.....

    whois gaoland.net
    Registrant:
    LDCOM Networks (ldcomn0-org) = 9telecom

    Il ne s'agit pas pour autant du trafic généré par l'ensemble des clients 9t, mais bien par un seul goret.
  • # Un Nantais!

    Posté par  . Évalué à 3.

    Amis Nantais, vérifiez la configuration de vos logiciels!
    Petite erreur sur l'IP dans le journal, c'est: marriere-1-82-67-137-128.fbx.proxad.net

    Soit,
    http://francois04.free.fr/connex_dslam.php?dslam=marriere-1(...)
    • [^] # Re: Un Nantais!

      Posté par  (site web personnel) . Évalué à 2.

      Faudrait contacter free pour leur dire de couper la connexion du monsieur :/
      (zont le droit et ils l'ont deja fait il parait)
      • [^] # Re: Un Nantais!

        Posté par  (site web personnel) . Évalué à 10.

        Oh ! Du calme !
        Ce monsieur ne se rend tout simplement pas compte de ce qu'il a fait !
        Vouloir lui couper sa connexion pour le punir, c'est pas la premiere chose à faire ! Ne vaut t'il pas mieu que free contact se monsieur, explique le probleme et ensuite, s'il ne coopere pas, lui couper la connexion ?
        Je suis sur qu'il n'a pas fait expres.
        • [^] # Re: Un Nantais!

          Posté par  (site web personnel) . Évalué à 3.

          Ce monsieur ne se rend tout simplement pas compte de ce qu'il a fait !

          iptables, règle ECHO (ou MIRROR) sur l'ip du monsieur. Il va vite comprendre...

          Oups, je réglais mon iptables, l'ECHO est parti tout seul, désolé :o)

          --
          Dans le doute, frappe plus fort. (proverbe barbare)

          Proverbe Alien : Sauvez la terre ? Mangez des humains !

  • # Ahem...

    Posté par  . Évalué à 2.

    Gaoland, petite société ? Si on veut : C'est le réseau interne de LDCom, maison mère de 9 Télécom.

    Ceci dit, ça ne veut pas dire que leur requêtes HTTP sont légitimes .
    • [^] # Re: Ahem...

      Posté par  . Évalué à 8.

      Au moins y'a un mec qui s'intéresse à linux chez 9 telecom ;
      • [^] # Re: Ahem...

        Posté par  . Évalué à 5.

        Bah je trouve que neuf Tel est assez honnête envers Linux, qui est mentionné dans les notices d'install, ainsi que dans le détail des offres. La neuf Box peut fonctionner sur ethernet, la connection s'installe donc rapidement et sans heurt ... Personnelement je n'en attendais pas plus d'un fournisseur d'accés. Par contre je ne guarantis pas le SAV, dont je n'ai jamais eu besoin.
        • [^] # Re: Ahem...

          Posté par  (site web personnel) . Évalué à 3.

          Comme tout modem ethernet digne de ce nom la 9box fonctionne parfaitement en mode ethernet sous GNU/Linux. Gros point noir : 9TV réquisitionne le port ethernet donc 9TV + Linux = ===> [ ] a moins de passer en Wifi, car évidemment il n'y a pas de driver USB pour notre OS favori. Il semblerait cependant qu'une neufbox avec deux prises ethernets soit dans les cartons.
          • [^] # Re: Ahem...

            Posté par  . Évalué à 3.

            > Comme tout modem ethernet digne de ce nom la 9box fonctionne parfaitement en mode ethernet sous GNU/Linux.
            Je confirme !

            > Gros point noir : 9TV réquisitionne le port ethernet [etc]
            J'ai pas testé la chose mais en mettant un switch/hub derrière le port ethernet de la n9uf box (et branchant dessus le pinguoin et la boitier tv), ça devrait marcher non ?
      • [^] # Re: Ahem...

        Posté par  . Évalué à 2.

        en tant que client 9t tu obtiens souvent un host en gaoland.net, donc désolé de te décevoir, mais faudra se contenter de :

        " Au moins y'a un mec qui s'intéresse à linux client chez 9 telecom"
      • [^] # Re: Ahem...

        Posté par  . Évalué à 2.

        > Au moins y'a un mec qui s'intéresse à linux chez 9 telecom
        Je pense plutôt à l'IP d'un abonné n9uf tel...

        Exemple : ma machine (patlenain.dyndns.org) a actuellement pour ip 84.97.32.XX, ce qui donne en faisant un reverse XX.32.97-84.rev.gaoland.net.

        Pour info, voila ce que me donne un traceroute :
        6 * ldcom.freeix.net (213.228.3.241) 45.230 ms 47.100 ms
        7 v3994.c1cbv.gaoland.net (212.94.162.209) 45.966 ms 44.320 ms 43.930 ms
        8 v4084.core1.ren.gaoland.net (212.94.161.98) 48.954 ms 53.392 ms 51.911 ms 9 v4083.core1.bdx.gaoland.net (212.94.161.105) 57.952 ms 73.355 ms 63.915 ms
        10 172.22.0.233 (172.22.0.233) 59.006 ms 60.322 ms 58.925 ms
        11 18.21.96-84.rev.gaoland.net (84.96.21.18) 68.064 ms 67.298 ms 71.903 ms
        12 * * *
        • [^] # Re: Ahem...

          Posté par  (site web personnel) . Évalué à 6.

          pourquoi les XX alors que le patlenain.dyndns.org nous donne ton ip et tout et tout?
          • [^] # Re: Ahem...

            Posté par  . Évalué à 3.

            Pour faire travailler un peu les petits malins qui veulent hacker ma machine :)
          • [^] # Re: Ahem...

            Posté par  . Évalué à 7.

            Parce que c'est beaucoup plus sympa d'écrire son IP en chiffres romains.
            Pat, reviens, ta hache nous manque ! ;)
            • [^] # Re: Ahem...

              Posté par  . Évalué à 3.

              \o/ bmcounet \o/ ça faisait longtemps !

              --
              Ma hache est toujours bien affûtée !
  • # Et firefox ?

    Posté par  (site web personnel) . Évalué à 7.

    Quelle est la frequence d'actualisation des lives bookmarks de firefox ?
    Parce que je laisse souvent firefox ouvert et il y a plusieur live bookmark dans la barre personnelle
    • [^] # Re: Et firefox ?

      Posté par  . Évalué à 3.

      "Les États-Unis sont le seul pays à être passé de la barbarie à la décadence sans connaître la civilisation." -- Albert Einstein

      Cette citation n'est pas d'Einstein !
      Elle date d'avant et est de Georges Bernard Shaw (elle a aussi été attribuée à Oscar Wilde), et en version originale :
      « America is the only country that went from barbarism to decadence without civilization in between. »

      C'est fou le nombre de gens qui ont repris cette fausse attribution... (je viens de voir ça avec Google)
  • # ovh.net

    Posté par  . Évalué à 4.

    C'est un hebergeur (payant).

    Donc il doit s'agir d'un site qui syndique, ou meme plusieurs. Dans ce cas ca peut peut-etre justifier un gros traffic (si une dizaine de sites heberges chez ovh font un hit toutes les 30 minutes).

    A part ca, linuxfr.org devrait etre configure pour blacklister automatiquement les syndicateurs abusifs.
    • [^] # Re: ovh.net

      Posté par  (site web personnel, Mastodon) . Évalué à 4.

      A part ca, linuxfr.org devrait etre configure pour blacklister automatiquement les syndicateurs abusifs.

      Un truc dans le genre va probablement être codé, sans que ça fasse ramer le serveur.
      • [^] # Re: ovh.net

        Posté par  . Évalué à 7.

        Tiens j'aurais utilisé iptables pour ça, pas PHP.
        • [^] # Re: ovh.net

          Posté par  (site web personnel, Mastodon) . Évalué à 2.

          Ai-je indiqué ce qui serait utilisé ? Evidemment que PHP ne sera pas utilisé ... Pour iptables ce n'est pas non plus la solution, tu ne peux même pas prévenir le mec qu'il est blacklisté...
          • [^] # Re: ovh.net

            Posté par  . Évalué à 5.

            Pour prévenir le type qu'il abuse, je vois comme solution d'envoyer un faux flux RSS aux personnes qui le réclamment trop souvent :)

            Enfin il reste que pour moi le gachi de ressources est un gros problème des flux RSS/ATOM. Quand on voit en plus des logiciels comme Thunderbird qui ne sont pas capables de voir un code de retour HTTP 304... Pffff...
            • [^] # Re: ovh.net

              Posté par  . Évalué à 1.

              as tu ouvert quelque chose sur bugzilla à ce sujet ?
              • [^] # Re: ovh.net

                Posté par  . Évalué à 2.

                Ça me semble évident que ça y est déjà vu le nombre de gens qui en parlent...

                (après vérification, c'est bien sur bugzilla)
              • [^] # Re: ovh.net

                Posté par  . Évalué à 9.

                Et si l'on ne se contentait plus de répondre :
                As tu ouvert quelque chose sur bugzilla à ce sujet ?


                Mais plutôt :


                Je viens justement d'aller voir sur bugzilla et il ne semble pas y avoir de rapport ouvert à ce sujet.
                Vu que tu as l'air de connaitre le problème, est-ce que tu souhaites le soumettre ?
                Si tu n'as pas la possibilité ou l'envie de le faire, je veux bien le faire, mais je pense qu'il serait bon que tu y apportes ta contribution, car je n'ai pas toutes les infos pour faire un bon rapport.


                Ou encore :


                Je viens justement d'aller voir sur bugzilla et je n'ai pas trouvé de rapport ouvert à ce sujet.
                Je l'ai donc ouvert (donner ici la référence).
                Vu que tu as l'air de connaitre le problème, je te propose d'aller le compléter pour en améliorer la qualité.
    • [^] # Re: ovh.net

      Posté par  . Évalué à 2.

      Pour un peu que ce soit un seul site avec un traffic assez moyen, qui ne cache pas la syndic, bah on obtient un traffic démesuré... :-(
  • # User agent

    Posté par  . Évalué à 3.

    A la suite de la lecture de ton journal, je suis allé voir les stats, et je suis étonné de ne pas voir Opera dans les différents User agent. Je me suis déchiré ou quoi ?
  • # Détails

    Posté par  (site web personnel) . Évalué à 6.

    Pour 82.17.137.28 il a fait ses hits en 2 jours (le WE dernier) et a été blacklisté niveau iptables depuis. J'ai signalé à abuse deimanche...
    Ce qui m'inquiete c'est que lundi/mardi on a eu un autre centericq qui nous faisait aussi plus de 10 requetes par seconde, et l'abuse d'ovh a reglé ca en quelques heures mardi, ce soft aurait il un mode "bourrin" qui recharge en boucle ou un bug ?
    • [^] # Re: Détails

      Posté par  (site web personnel) . Évalué à 3.

      J'ai l'impression qu'il faudrait voir si ca serait pas une backdoor dedans ou un truc du genre
      Enfin plus généralement voir les points communs
      Non pas que je sois un fataliste pessimiste mais bon c'est pas impossible si?
  • # 10 visites par jour, c'est trop ?

    Posté par  (site web personnel) . Évalué à 2.

    Bien ou pas bien, je sais pas... Mais je fais largement plus de 10 visites par jour, entre les journaux, les forums et les commentaires que je veux suivre... Alors, abusif ou pas ? Je sais pas trop... Faudrait qu'on me chiffre ça... Je suis TRES étonné de voir que quelqu'un qui vient plus de 10 fois par jour puisse être nuisible, j'avais aucune idée d'à partir de quand un visiteur pouvait charger ou pas un serveur. Mais je suis tout-à-fait OK pour limiter mes visites, même si ça me fera beaucoup de peine !
    Déjà que j'ai toutes les peines du monde à convaincre mon entourage que vérifier son compte POP toutes les 25 minutes, c'est amplement suffisant, et plus intelligent que toutes les minutes (heureusement que les mailers proposent pas d'entrer des secondes, sinon, j'en connais qui mettraient toutes les 1 sec !)
    • [^] # Re: 10 visites par jour, c'est trop ?

      Posté par  (site web personnel) . Évalué à 1.

      Ha oui, aussi : je suis client Neuf, et la machine qui me connecte est toujours gaoland.net (chez moi ou chez ma famille, à 400 km de distance, on est toujours sur gaoland)... :-(
      Mais je peux pas croire que ce soit moi.
  • # Rafraîchissement des feeds

    Posté par  . Évalué à 2.

    Ben que conseillez vous pour la fréquence de rafraîchissement des feeds ?
    J'ai mis 5 minutes dans mon akregator. C'est trop petit ?
    • [^] # Re: Rafraîchissement des feeds

      Posté par  . Évalué à 2.

      Pour les news, j'ai mis 60 minutes.
      Pour les journaux et les forums, 10 minutes.
    • [^] # Re: Rafraîchissement des feeds

      Posté par  . Évalué à 8.

      Facile, tu divises 24 heures par le nombre moyen de news qui parait dans une journée. AH! Zut! Illegal division by zero error.
      • [^] # Re: Rafraîchissement des feeds

        Posté par  . Évalué à 0.

        ta dernière news publiée date de 2003... Commence par en proposer avant de faire ce type de remarque.
        • [^] # Re: Rafraîchissement des feeds

          Posté par  (site web personnel) . Évalué à 1.

          Comment ça ? Ni le troll, ni l'humour n'ets plus autorisé sur linuxfr ?
          Et puis il ne critique pas le fait qu'il n'y a pas assez de news (même s'il peut le penser) mais il observe la rareté des news ...

          Sans faire de polémique, peut-on savoir combien de news sont postées/refusées par jour ?

          Bon troll (avec modération) et vive l'humour (avec compéhension)

          Théo
    • [^] # Re: Rafraîchissement des feeds

      Posté par  (site web personnel, Mastodon) . Évalué à 3.

      30min me paraît largement plus que suffisant...
    • [^] # Re: Rafraîchissement des feeds

      Posté par  (site web personnel, Mastodon) . Évalué à 4.

      Il y a dans les specs de rss, un tag qui peut être utilisé pour indiquer à l'aggrégateur quand rafraichir le flux. Je pense donc que si akregator est bien fait il respectera ce délai. Par contre, si le flux linuxfr ne l'utilise pas, bon ben je suppose qu'une fois par heure ça devrait être bon.
      • [^] # Re: Rafraîchissement des feeds

        Posté par  . Évalué à 6.

        Attendez, là...
        Le post initial ne disait pas "réduisez tous vos rafraîchissements" !

        Je ne voulais absolument pas culpabiliser tout le monde, ni inciter à la restriction, mais juste attirer l'attention sur le comportement crétin d'un individu (même si actuellement, la question est de savoir si il y a un bug ou une back-door dans centericq).

        (mais dans la série, si vous réduisez tous votre gâchis d'eau -pour continuer sur l'analogie du robinet-, la planète vous en sera reconnaissante ; là, un effort collectif est vraiment nécessaire...)

        Un refresh à 10 ou 30 minutes, ça ne change pas grand chose : ça laisse un facteur 1000 avec ce qui était observé.

        Un bon moyen pour paramétrer ça, c'est de se demander tous les combien de temps on irait voir la page de façon naturelle, et de diviser ce temps par 2.
        Si vous venez toutes les 2 heures, un refresh d'1h fera l'affaire.
        Etc, etc.
        (Et si vous venez toutes les 2 secondes, alors ok pour un refresh d'1 seconde...)
        • [^] # Re: Rafraîchissement des feeds

          Posté par  (site web personnel) . Évalué à 4.

          Un bon moyen de configurer ça ça serait surtout un aggregateur qui modifie en dynamique sa fréquence de rafraichissement en fonction de la fréquence de mise à jour et de la fréquence de lecture.
          Si l'aggregateur n'est pas lu souvent on baisse la fréquence (pas la peine de poller toutes les 10 minutes pendant la nuit ou pendant qu'on travaille), si le feed fait en gros deux mises à jour par semaine on limite les fréquences à 1 requête/jour max.
          Moi c'est vraiment un aggregateur intelligent de ce style que j'aimerai voir arriver, ça bénéficie à l'utilisateur (qui bénéficie d'une fréquence de rafraichissement adaptée si d'un coup un site gagne en acivité) et aux sites (qui bénéficient d'une baisse du nombre de requêtes quand l'aggregateur n'est pas lu ou que le site a peu d'actu)
  • # Ne pas tout confondre

    Posté par  (site web personnel) . Évalué à 3.

    Bon pour le client centericq, je dis pas, y a effectivement un souci.

    Quant à gaoland, et ovh, rien de plus normal à mon avis !
    Combien d'abonnés 9tel (dont moi) ont ce domaine à la connexion... Il est tout à fait normal que tout plein de gens consultent linuxfr, non ?
    Ovh est un hébergeur payant, proposant même de l'hébergement dédié. Il y a sans doute quelques agrégateurs en ligne sur quelques serveurs chez ovh (j'en ai développé un qui ne sert pas qu'à moi), donc un moyen justement de réduire la bw de linuxfr en regroupant sur un outil social des requêtes qui pourraient sinon être faites par plusieurs personnes.

    Maintenant pour réduire l'effet de charge des agrégateurs de fils sur linuxfr, il y a les balises ttl et skipHours qui peuvent aider (si les agregateurs les interprètent, l'encodage gz (mod_gzip) des flux, et de façon expérimentale, la RFC3229 (HTTP deltas) qui permet de ne télécharger qu'une partie en http (mod_speedyfeed sur apache2).

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.