Le serveur rame cet après-midi, alors j'en profite pour faire un tour au royaume des statistiques...
Que trouve-t-on ?
Le 82.17.137.28, chez Free, a fait sur le site 2 visites en février (15 jours), et il a réussi à totaliser 1 681 792 hits.
L'adresse répond en SSH, donc c'est probablement un particulier (et pas un proxy d'entrerprise, j'entends)
Pas mal...
On pourrait penser à un aspirateur lancé à travers...
Non : si on corrèle ça avec les "navigateurs" :
1 687 579 hits pour le "navigateur" centericq : c'est un Instant Messenger, très probablement utilisé comme "news reader".
Le plus amusant, c'est qu'il n'y a pas eu de "pic" de connexions en février : le gus qui a lancé son ICQ sur linux.fr l'a laissé tourner depuis 15 jours...
Ca fait donc 100 000 hits par jour, soit 1 hit par seconde.
Chaque seconde, ce PC fait une requête pour récupérer le flux RSS de linuxfr.org
C'est du n'importe-quoi...
(hep, toi qui utilises centericq , tu me lis, hein ? tu peux le configurer stp ?)
ovh.net a lancé 734 931 requêtes en 44 visites. Bien aussi.
Je ne sais pas bien ce qu'est ovh.net. Donc je ne sais pas si un tel usage est pertinent...
Puis vient gaoland.net : 83 720 hits, en 167 visites en 15 jours : 10 visites par jour !
www.gaoland.net nécessite un mot de passe ; c'est probablement une petite société, voire un particulier.
Les personnes ont tout de même consommé 1.7 Go, soit 2% du total...
C'est du n'importe-quoi aussi.
Qu'en déduit-on ?
Que les gens font n'importe quoi avec leurs outils ; ou bien qu'ils ne savent pas les configurer. Mais une requête vers un flux RSS à chaque seconde, ce n'est pas une config par défaut. L'irresponsable a sans doute sciemment lancé ça en disant "tant que celà fonctionne, continuons." Et celui qui consomme à lui tout seul 2% du volume du site ferait bien aussi de réfléchir à l'utilité de ça.
Internet n'est pas gratuit : la bande passante coûte cher, le matériel aussi.
De telles requêtes, ça fait vraiment penser à un robinet ouvert : c'est complètement inutile, mais, au fond, tant que c'est individuel, tout le monde s'en fout ; mais si ce comportement se généralise, ce sera la catastrophe...
# Gaoland.net
Posté par sk . Évalué à 10.
Un whois par exemple permet d'apprendre que c'est rattaché à LDCOM (donc à Neuf Telecom...). Que ca prenne 2% du volume du site me choque un peu moins du coup.
[^] # Re: Gaoland.net
Posté par François Obada . Évalué à 2.
[^] # Re: Gaoland.net
Posté par symoon . Évalué à 6.
il dit qu'il voit pas le rapport
[^] # Re: Gaoland.net
Posté par sherlokk . Évalué à 2.
# Des mauvais usages des nouvelles technologies...
Posté par Jllc . Évalué à 10.
Reste maintenant à éduquer, comme pour la divulgation des adresse mail sur le net (excellent pour chopper des spams), les virus ...
# Humour....
Posté par Volnai . Évalué à 9.
C'est du n'importe-quoi...
Tout à fait, surtout qu'avec la vitesse d'apparition des news sur DLFP, il à peu de chance d'en rater une, meme s'il ne récupère le RSS qu'une fois par moi...
[^] # Re: Humour....
Posté par Nico C. . Évalué à 8.
m'enfin, un flux rss rafraichi 2x/j et encore suffit tres tres largement
Imbolcus
A vot' service
[^] # Re: Humour....
Posté par Amaury . Évalué à 2.
[^] # Re: Humour....
Posté par Volnai . Évalué à 5.
Et puis ce n'est pas ma faute, je suis utilisateur debian, j'attends que sarge passe en stable pour faire une news.
Des fois je me dit que si je passais à Mandrake, ca serais plus facile, entre les Alpha/beta/ releases et les bugs dont on parle entre les release, y'a de quoi meubler a la fois les journaux et les news.
Et puis de toute façon sur linuxfr, c'est pas le nombre de news publiés qui fait un homme, c'est les XP.
Le titre du commentaire c'est toujours "Humour", on est bien d'accord...
# gaoland... + man whois
Posté par symoon . Évalué à 9.
Pas gaoland.net, mais un hôte de ce domaine.
www.gaoland.net nécessite un mot de passe ; c'est probablement une petite société, voire un particulier.
Oui une petite société ou un particulier.....
whois gaoland.net
Registrant:
LDCOM Networks (ldcomn0-org) = 9telecom
Il ne s'agit pas pour autant du trafic généré par l'ensemble des clients 9t, mais bien par un seul goret.
# Un Nantais!
Posté par N. D. . Évalué à 3.
Petite erreur sur l'IP dans le journal, c'est: marriere-1-82-67-137-128.fbx.proxad.net
Soit,
http://francois04.free.fr/connex_dslam.php?dslam=marriere-1(...)
[^] # Re: Un Nantais!
Posté par Ph Husson (site web personnel) . Évalué à 2.
(zont le droit et ils l'ont deja fait il parait)
[^] # Re: Un Nantais!
Posté par Maxime (site web personnel) . Évalué à 10.
Ce monsieur ne se rend tout simplement pas compte de ce qu'il a fait !
Vouloir lui couper sa connexion pour le punir, c'est pas la premiere chose à faire ! Ne vaut t'il pas mieu que free contact se monsieur, explique le probleme et ensuite, s'il ne coopere pas, lui couper la connexion ?
Je suis sur qu'il n'a pas fait expres.
[^] # Re: Un Nantais!
Posté par Loïs Taulelle ࿋ (site web personnel) . Évalué à 3.
iptables, règle ECHO (ou MIRROR) sur l'ip du monsieur. Il va vite comprendre...
Oups, je réglais mon iptables, l'ECHO est parti tout seul, désolé :o)
--
Dans le doute, frappe plus fort. (proverbe barbare)
Proverbe Alien : Sauvez la terre ? Mangez des humains !
# Ahem...
Posté par mac . Évalué à 2.
Ceci dit, ça ne veut pas dire que leur requêtes HTTP sont légitimes .
[^] # Re: Ahem...
Posté par Anonyme . Évalué à 8.
[^] # Re: Ahem...
Posté par jmitch . Évalué à 5.
[^] # Re: Ahem...
Posté par Benoît Déchamps (site web personnel) . Évalué à 3.
[^] # Re: Ahem...
Posté par Pat Le Nain . Évalué à 3.
Je confirme !
> Gros point noir : 9TV réquisitionne le port ethernet [etc]
J'ai pas testé la chose mais en mettant un switch/hub derrière le port ethernet de la n9uf box (et branchant dessus le pinguoin et la boitier tv), ça devrait marcher non ?
[^] # Re: Ahem...
Posté par Julien L . Évalué à 1.
[^] # Re: Ahem...
Posté par Pat Le Nain . Évalué à 3.
[^] # Re: Ahem...
Posté par symoon . Évalué à 2.
" Au moins y'a un mec qui s'intéresse à linux client chez 9 telecom"
[^] # Re: Ahem...
Posté par Pat Le Nain . Évalué à 2.
Je pense plutôt à l'IP d'un abonné n9uf tel...
Exemple : ma machine (patlenain.dyndns.org) a actuellement pour ip 84.97.32.XX, ce qui donne en faisant un reverse XX.32.97-84.rev.gaoland.net.
Pour info, voila ce que me donne un traceroute :
6 * ldcom.freeix.net (213.228.3.241) 45.230 ms 47.100 ms
7 v3994.c1cbv.gaoland.net (212.94.162.209) 45.966 ms 44.320 ms 43.930 ms
8 v4084.core1.ren.gaoland.net (212.94.161.98) 48.954 ms 53.392 ms 51.911 ms 9 v4083.core1.bdx.gaoland.net (212.94.161.105) 57.952 ms 73.355 ms 63.915 ms
10 172.22.0.233 (172.22.0.233) 59.006 ms 60.322 ms 58.925 ms
11 18.21.96-84.rev.gaoland.net (84.96.21.18) 68.064 ms 67.298 ms 71.903 ms
12 * * *
[^] # Re: Ahem...
Posté par Calim' Héros (site web personnel) . Évalué à 6.
[^] # Re: Ahem...
Posté par Pat Le Nain . Évalué à 3.
[^] # Re: Ahem...
Posté par bmc . Évalué à 7.
Pat, reviens, ta hache nous manque ! ;)
[^] # Re: Ahem...
Posté par Pat Le Nain . Évalué à 3.
--
Ma hache est toujours bien affûtée !
# Et firefox ?
Posté par inico (site web personnel) . Évalué à 7.
Parce que je laisse souvent firefox ouvert et il y a plusieur live bookmark dans la barre personnelle
[^] # Re: Et firefox ?
Posté par Olivier Jeannet . Évalué à 3.
Cette citation n'est pas d'Einstein !
Elle date d'avant et est de Georges Bernard Shaw (elle a aussi été attribuée à Oscar Wilde), et en version originale :
« America is the only country that went from barbarism to decadence without civilization in between. »
C'est fou le nombre de gens qui ont repris cette fausse attribution... (je viens de voir ça avec Google)
[^] # Re: Et firefox ?
Posté par zerchauve . Évalué à 3.
[^] # Re: Et firefox ?
Posté par jcs (site web personnel) . Évalué à 2.
Clemenceau s'écrit sans accent et se prononce d'ailleurs Cleumenceau et non pas Clémenceau.
[^] # Re: Et firefox ?
Posté par inico (site web personnel) . Évalué à -6.
On en a déjà parler !
[^] # Re: Et firefox ?
Posté par yoho (site web personnel) . Évalué à 2.
Autant je t'autorise à ne pas connaître les auteurs de citations par coeur, autant tu pourrais faire un effort quand tu publies.
[^] # Re: Et firefox ?
Posté par Olivier Jeannet . Évalué à 1.
Je n'en ai jamais entendu parler par lui, tu as des sources de ce que tu avances ?
[^] # Re: Et firefox ?
Posté par Benoît Bailleux (Mastodon) . Évalué à 0.
# ovh.net
Posté par Erwan . Évalué à 4.
Donc il doit s'agir d'un site qui syndique, ou meme plusieurs. Dans ce cas ca peut peut-etre justifier un gros traffic (si une dizaine de sites heberges chez ovh font un hit toutes les 30 minutes).
A part ca, linuxfr.org devrait etre configure pour blacklister automatiquement les syndicateurs abusifs.
[^] # Re: ovh.net
Posté par Fabien Penso (site web personnel, Mastodon) . Évalué à 4.
Un truc dans le genre va probablement être codé, sans que ça fasse ramer le serveur.
[^] # Re: ovh.net
Posté par Ramso . Évalué à 7.
[^] # Re: ovh.net
Posté par Fabien Penso (site web personnel, Mastodon) . Évalué à 2.
[^] # Re: ovh.net
Posté par Wawet76 . Évalué à 5.
Enfin il reste que pour moi le gachi de ressources est un gros problème des flux RSS/ATOM. Quand on voit en plus des logiciels comme Thunderbird qui ne sont pas capables de voir un code de retour HTTP 304... Pffff...
[^] # Re: ovh.net
Posté par olaf . Évalué à 1.
[^] # Re: ovh.net
Posté par Wawet76 . Évalué à 2.
(après vérification, c'est bien sur bugzilla)
[^] # Re: ovh.net
Posté par figus . Évalué à 9.
Mais plutôt :
Je viens justement d'aller voir sur bugzilla et il ne semble pas y avoir de rapport ouvert à ce sujet.
Vu que tu as l'air de connaitre le problème, est-ce que tu souhaites le soumettre ?
Si tu n'as pas la possibilité ou l'envie de le faire, je veux bien le faire, mais je pense qu'il serait bon que tu y apportes ta contribution, car je n'ai pas toutes les infos pour faire un bon rapport.
Ou encore :
Je viens justement d'aller voir sur bugzilla et je n'ai pas trouvé de rapport ouvert à ce sujet.
Je l'ai donc ouvert (donner ici la référence).
Vu que tu as l'air de connaitre le problème, je te propose d'aller le compléter pour en améliorer la qualité.
[^] # Re: ovh.net
Posté par dripple . Évalué à 2.
# User agent
Posté par 桃白白 . Évalué à 3.
[^] # Re: User agent
Posté par chtitux (site web personnel) . Évalué à 1.
# | Hits | User | Agent
13 |129784 | 0.40% | Opera/7.5
On ne doit pas voir la même chose ... :-)
Sinon, on remarquera les plus de 3 % de *coincoin ... beau score pour un logiciel pratiquement dédié aux moules à linuxfr.org ...
[^] # Re: User agent
Posté par 桃白白 . Évalué à 2.
# Détails
Posté par Pascal Terjan (site web personnel) . Évalué à 6.
Ce qui m'inquiete c'est que lundi/mardi on a eu un autre centericq qui nous faisait aussi plus de 10 requetes par seconde, et l'abuse d'ovh a reglé ca en quelques heures mardi, ce soft aurait il un mode "bourrin" qui recharge en boucle ou un bug ?
[^] # Re: Détails
Posté par Ph Husson (site web personnel) . Évalué à 3.
Enfin plus généralement voir les points communs
Non pas que je sois un fataliste pessimiste mais bon c'est pas impossible si?
# 10 visites par jour, c'est trop ?
Posté par Zorro (site web personnel) . Évalué à 2.
Déjà que j'ai toutes les peines du monde à convaincre mon entourage que vérifier son compte POP toutes les 25 minutes, c'est amplement suffisant, et plus intelligent que toutes les minutes (heureusement que les mailers proposent pas d'entrer des secondes, sinon, j'en connais qui mettraient toutes les 1 sec !)
[^] # Re: 10 visites par jour, c'est trop ?
Posté par Zorro (site web personnel) . Évalué à 1.
Mais je peux pas croire que ce soit moi.
[^] # Re: 10 visites par jour, c'est trop ?
Posté par chl (site web personnel) . Évalué à 10.
Toi et ta famille vous allez etre blacklistés de linuxfr. Vous etes DINGUES de faire 10 visites par jour !!
[^] # Re: 10 visites par jour, c'est trop ?
Posté par Jean-Luc Henry . Évalué à 2.
Il y a quand même une sacrée différence!
[^] # Re: 10 visites par jour, c'est trop ?
Posté par niol (site web personnel) . Évalué à 2.
Un hit correspond à une ligne des les logs du serveur web. (typiquement une pour la page, une pour la CSS, une pour le logo et une pour le favicon, plus une pour chacun des petits icones).
Une visite peut avoir plusieurs définitions. Pour webalizer (configuration par défaut), deux requètes espacées de moins de 30 minutes consituent une seule visite. Sachant que seule les requètes sur des pages webs (html) peuvent constituer des visites.
source : http://www.webhostingforidiots.com/helpdesk/webstathelp.html(...)
# Rafraîchissement des feeds
Posté par Pinaraf . Évalué à 2.
J'ai mis 5 minutes dans mon akregator. C'est trop petit ?
[^] # Re: Rafraîchissement des feeds
Posté par Pat Le Nain . Évalué à 2.
Pour les journaux et les forums, 10 minutes.
[^] # Re: Rafraîchissement des feeds
Posté par imr . Évalué à 8.
[^] # Re: Rafraîchissement des feeds
Posté par Amaury . Évalué à 0.
[^] # Re: Rafraîchissement des feeds
Posté par chtitux (site web personnel) . Évalué à 1.
Et puis il ne critique pas le fait qu'il n'y a pas assez de news (même s'il peut le penser) mais il observe la rareté des news ...
Sans faire de polémique, peut-on savoir combien de news sont postées/refusées par jour ?
Bon troll (avec modération) et vive l'humour (avec compéhension)
Théo
[^] # Re: Rafraîchissement des feeds
Posté par Fabien Penso (site web personnel, Mastodon) . Évalué à 3.
[^] # Re: Rafraîchissement des feeds
Posté par Nicolas Évrard (site web personnel, Mastodon) . Évalué à 4.
[^] # Re: Rafraîchissement des feeds
Posté par charlieecho . Évalué à 6.
Le post initial ne disait pas "réduisez tous vos rafraîchissements" !
Je ne voulais absolument pas culpabiliser tout le monde, ni inciter à la restriction, mais juste attirer l'attention sur le comportement crétin d'un individu (même si actuellement, la question est de savoir si il y a un bug ou une back-door dans centericq).
(mais dans la série, si vous réduisez tous votre gâchis d'eau -pour continuer sur l'analogie du robinet-, la planète vous en sera reconnaissante ; là, un effort collectif est vraiment nécessaire...)
Un refresh à 10 ou 30 minutes, ça ne change pas grand chose : ça laisse un facteur 1000 avec ce qui était observé.
Un bon moyen pour paramétrer ça, c'est de se demander tous les combien de temps on irait voir la page de façon naturelle, et de diviser ce temps par 2.
Si vous venez toutes les 2 heures, un refresh d'1h fera l'affaire.
Etc, etc.
(Et si vous venez toutes les 2 secondes, alors ok pour un refresh d'1 seconde...)
[^] # Re: Rafraîchissement des feeds
Posté par Éric (site web personnel) . Évalué à 4.
Si l'aggregateur n'est pas lu souvent on baisse la fréquence (pas la peine de poller toutes les 10 minutes pendant la nuit ou pendant qu'on travaille), si le feed fait en gros deux mises à jour par semaine on limite les fréquences à 1 requête/jour max.
Moi c'est vraiment un aggregateur intelligent de ce style que j'aimerai voir arriver, ça bénéficie à l'utilisateur (qui bénéficie d'une fréquence de rafraichissement adaptée si d'un coup un site gagne en acivité) et aux sites (qui bénéficient d'une baisse du nombre de requêtes quand l'aggregateur n'est pas lu ou que le site a peu d'actu)
# Ne pas tout confondre
Posté par Talou (site web personnel) . Évalué à 3.
Quant à gaoland, et ovh, rien de plus normal à mon avis !
Combien d'abonnés 9tel (dont moi) ont ce domaine à la connexion... Il est tout à fait normal que tout plein de gens consultent linuxfr, non ?
Ovh est un hébergeur payant, proposant même de l'hébergement dédié. Il y a sans doute quelques agrégateurs en ligne sur quelques serveurs chez ovh (j'en ai développé un qui ne sert pas qu'à moi), donc un moyen justement de réduire la bw de linuxfr en regroupant sur un outil social des requêtes qui pourraient sinon être faites par plusieurs personnes.
Maintenant pour réduire l'effet de charge des agrégateurs de fils sur linuxfr, il y a les balises ttl et skipHours qui peuvent aider (si les agregateurs les interprètent, l'encodage gz (mod_gzip) des flux, et de façon expérimentale, la RFC3229 (HTTP deltas) qui permet de ne télécharger qu'une partie en http (mod_speedyfeed sur apache2).
[^] # Re: Ne pas tout confondre
Posté par Talou (site web personnel) . Évalué à 3.
http://www.w3.org/Protocols/rfc2616/rfc2616-sec10.html(...)
[^] # Re: Ne pas tout confondre
Posté par chtitux (site web personnel) . Évalué à 3.
L'adresse 10.21.96-84.rev.gaoland.net pointe sur un site. Cette IP est privée et ne regroupe pas les utilisateurs de 9F, pas comme proxy2-a.proxad.net par exemple, qui lui rassemble tout ceux qui servent derriere ce cache (si cache il y a ...)
On peut s'amuser à vérifier que 10.21.96-84.rev.gaoland.net est bien une adresse "privée" car http://11.21.96-84.rev.gaoland.net/(...) point sur un serveur Apache/*BSD, et http://10.22.96-84.rev.gaoland.net/(...) sur une régie de pub ...
[^] # Re: Ne pas tout confondre
Posté par Pascal Terjan (site web personnel) . Évalué à 3.
Depuis qu'il utilise "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.7.5) Gecko/20041206 Thunderbird/1.0" il ne fait plus que recharger integralement 2 RSS toutes les 20 minutes (ce qui ne charge pas la machine mais bon c'est du gachis de BP). Cela me fait remarquer qu'il semble que Thunderbird sux, il recharge toujours tout le RSS même s'il n'a pas changé...
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.