Forum général.général Shutdowns intempestifs

Posté par  (site web personnel) .
Étiquettes : aucune
0
1
fév.
2005
Bonjour,

J'ai un serveur connecté sur internet (sous Debian/Testing avec noyau 2.6.9) qui a une facheuse tendance à s'arrêter sauvagement de temps à autres, avec une fréquence qui va croissante (souvent une fois tous les deux ou trois jours ces temps-ci, parfois deux ou trois fois dans la journée si je suis là pour le redémarrer !!).
Je suppute un problème d'alim qui est en train de ma lâcher, mais je me demandais aussi si un ver/virus/rootkit sorti de je ne sais où ne pourrait pas en être la cause.
Dans tous les cas, comment m'en assurer avant de me lancer dans le changement de mon alim ??

Toute information sur le sujet m'intéresse fortement...
  • # snort

    Posté par  . Évalué à 0.

    http://www.snort.org/
    • [^] # Re: snort

      Posté par  (site web personnel) . Évalué à 2.

      Heu... Snort est installé aussi, mais avec la config de base de la Debian, histoire de voir à quoi ça ressemble (et puis il faut bien utiliser la CPU !).
      Je n'ai pas eu le temps de regarder la doc en détail (et ça a l'air bien assez chiadé pour moi qui ne suis pas du genre foudroyant question réseau !!) ; je reçois bien des alertes tous les jours, mais rien à ma connaissance qui soit identifié comme des traces de rootkit.
  • # ...petite précision...

    Posté par  (site web personnel) . Évalué à 1.

    juste pour indiquer que bien évidemment, il s'agit d'un arrêt brutal, et non d'un joli shutdown avec arrêt des services et tout et tout... (merci, ext3 !!).
    Autre point : il suffit de mettre on/off l'interrupteur présent sur l'alim pour que la machine reparte directement. Ce qui me laisse bien à penser qu'il s'agit d'un problème de la sus-dite alim mais bon...

    Merci.
  • # Ventilateurs

    Posté par  (site web personnel) . Évalué à 0.

    Tes ventilateurs alim et surtout processeurs tournent-ils encore ? Et si
    oui correctement ?
    • [^] # Re: Ventilateurs

      Posté par  (site web personnel) . Évalué à 1.

      A priori, oui.
      J'ai installé les capteurs de température dans le kernel avec des outils de capture en Python via sysfs et des graphes via RRDTOOL.
      La température de la CPU ne dépasse pas les 50°, ce qui me semble un niveau normal (c'est un Athlon XP 1700+).
      Je n'ai pas constaté de bruit suspect.
  • # Elle a quel age ta carte mére ?

    Posté par  (site web personnel) . Évalué à 1.

    Si ta carte a été produite entre 1999 et 2002, et qu'elle marche bien depuis un bon moment, il y a de forte chance que tu sois atteint du syndrome des condensateurs pourris... tout une série de condo utilisé pour le filtrage de l'alim des processeurs (sur la carte mére) son defectueux (pour une sombre raison de vol de formule de dielectrique).

    Si ta carte est un peu vieille, regarde la de près et surtout les condo autour des processeurs voir si le dessus n'est pas bombé et qu'il n'y a pas de fuite d'une substance marron (toujours ?) à la base... si tu es dans un de ces cas de figure, soit tu es un dieu du fer à souder soir tu jette ta carte (ou me la donne ;-) )

    Gérald

    PS : qui va changer ce we les condos de sa BP6 qui vient de rendre l'ame à cause de ça après 4 ans H24....

    RePS : un lien : http://www.motherboardrepair.com/(...)
    • [^] # Re: Elle a quel age ta carte mére ?

      Posté par  (site web personnel) . Évalué à 1.

      Ma carte mère est une MSI K7T Turbo2 (de mémoire) qui doit bien dater de deux ou trois ans, donc je dois être dans le créneau.
      Mais jusqu'à présent, cette carte était celle de mon poste de travail, donc elle ne fonctionnait que deux à trois heures en moyenne par jour. Mais n'y a-t-il pas d'autres symptomes pour ce genre de panne (odeur...?). Je n'ai rien remarqué de suspect lorsque j'ai fait mon basculement le week-end dernier...

      Concernant une éventuelle soudure... j'ai fait de la soudure à l'arc sur des moissonneuses batteuses quand j'étais plus jeune. Tu crois que ça va aller ?? :-)))

      Sinon, j'ai deux cartes mères ASUS P2B (pour Pentium II ou III) qui sont HS. Si tu es intéressé, je brade...
      • [^] # Re: Elle a quel age ta carte mére ?

        Posté par  (site web personnel) . Évalué à 1.

        Concernant l'odeur, je ne sais pas, il y en a qui disent qu'il y en a, moi j'ai jamais trouvé... regarde bien les condos, faut regarder de près, cf les photos sur le site du lien...

        Pour les cartes, merci mais j'ai presque ce qu'il faut ! ;-)
  • # Rootkit et Matos...

    Posté par  . Évalué à 1.

    Pour vérifier ca il y a l'excellent

    chkrootkit

    Avec le tit deb qui va bien du meme nom dans ta distro favorie... :o)

    Mais perso je pencherais plutot pour un problème de hard....

    Question autre : As-tu vérifié que les condensateurs de ta carte mère se portent bien ???
    ( un classiques des serveurs 1U dans les data-center qui chauffent un peu trop, dont les condensateurs électro-chimique lachent, et finissent par rebooter ou s'arreter tout seul de manière régulière).
    • [^] # Re: Rootkit et Matos...

      Posté par  (site web personnel) . Évalué à 1.

      > chkrootkit
      >
      > Avec le tit deb qui va bien du meme nom dans ta distro favorie... :o)

      Oui, ça je l'ai installé.
      A priori il ne me trouve rien de suspect, mais jusqu'à présent je ne savais pas trop à quoi m'en tenir quant à la fiabilité du bouzin...

      > un classique des serveurs 1U dans les data-center...

      Oui, enfin, mon serveur 1U, c'est quand même jamais qu'un vieux PC ATX qui trône dans un coin du salon (et que ma femme adore, ça va de soi, elle ne s'en séparerait pour rien au monde...), par ailleurs peu chargé (1 DD, 1 CD, et une vieille carte graphique Millenium en PCI, pas de quoi fouetter un chat avec une alim de 300W).
  • # mémoire défaillante ?

    Posté par  . Évalué à 1.

    J'ai déjà pu observer ce genre de comportement avec une barette en train de rendre l'âme.

    Tu peux peut-être lancer un memtest avant de t'attaquer aux problèmes plus sérieux...
    • [^] # Re: mémoire défaillante ?

      Posté par  . Évalué à 1.

      Il y a 4-5 mois j'avais eu une barette de RAM défectueuse qui me causait un blocage du système, et un memtest (package debian: memtest86) m'a permis de diagnostiquer la cause.
      En revanche, je doute que ce soit la RAM qui te cause ton pb puisque tu nous dis que ce n'est pas un plantage mais un arrêt de la machine...

      Pour ce qui est de tes soupçons sur ton alim, as-tu essayé avec l'alim d'un copain ou d'une de tes autres machines ??
      J'ai aussi eu mon alim défaillante (remplacée depuis), mais ça bloquait mes disques durs à certains moments, et je devais rebooter méchamment si le disque système était ainsi paralysé. Je n'ai toujours pas compris pourquoi ça faisait ça, l'alim était peut-être un peu faiblarde aussi...
      Mais contrairement à ton ordi, ma tour a beaucoup de matos... je pense que tes 300W te suffisent amplement !
      • [^] # Re: mémoire défaillante ?

        Posté par  (site web personnel) . Évalué à 1.

        J'ai eu ça il y a quelques temps sur ma station, qui elle est... un peu chargée :-(
        A plusieurs reprises, je pouvais entendre un petit sifflement bref au niveau d'un disque et puis après plus rien : machine bloquée mais non éteinte (y compris l'affichage), reset obligatoire.
        Résultat du diagnostic : alim HS, elle a carrément refusé de marcher quelques jours plus tard (mais il faut dire qu'avec quatre disques -dont un SCSI- + CD + carte SCSI + (petite) carte graphique + carte d'acquisition + carte son sur une pôvre 300W, je l'avais un peu cherché !!).
        Dans mon cas actuel, la machine s'arrête carrément, et je dois faire on/off au niveau de l'interrupteur de l'alim (le bouton de reset ou l'interrupteur en façade, c'est comme pisser dans un violon !).

        Bon, je crois que je vais aller me chercher un alim chez le vendeur du coin...
  • # Un autre truc à vérifier.

    Posté par  . Évalué à 3.

    C'est véridique, ça m'est vraiment arrivé...

    J'avais un serveur. A l'époque ça devait etre une Suse 6.3 ou quelque chose comme ça, et moi aussi j'avais des problèmes de reboto intempestif et je pensais qu'on me faisait une blague ou que j'avais été piraté.

    En fait, la machine était installé à coté de serveurs NT. C'était un peu le bazar dans cette salle machine, et les claviers et les écrans n'étaient pas forcément très bien alignés. En gros, le clavier du serveur Linux était en face de l'écran de la machine NT.

    Pour faire une opération d'administration sur le serveur NT, les gens ouraient une session en appuyant sur CTRL-ALT-DEL. Puis ils s'apercevaient qu'ils s'étaient plantés de clavier et utilisaient le bon. Sauf qu'entre temps, bien sur, mon serverur Suse avait rebooté...
    • [^] # Re: Un autre truc à vérifier.

      Posté par  (site web personnel) . Évalué à 1.

      Moi je connais un pote qui avait un serveur sous windows (maintenant c'est fini il est passé sous linux) et qui avait rebooté un linux croyant ouvrir une session sur son NT .

      Que le monde est petit :)

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.