Forum Linux.général Problème de matériel : comment diagnostiquer ?

Posté par  .
Étiquettes :
0
1
nov.
2007
Depuis quelques jours je suis confronté à de bien étranges problèmes de segfault, sans cause apparente et sous plusieurs systèmes, que je soumet à la sagacité des moules qui peuplent ce rocher magique :

- hier soir je décide de consacrer ma soirée et la journée d'aujourd'hui à jouer un peu avec linux-vserver sous Slackware 12.0, et pas moyen de compiler le kernel, qui me renvoie inlassablement ces dernières lignes :

MODPOST vmlinux
BUILD arch/i386/boot/bzImage
Root device is (8, 3)
Boot sector 512 bytes.
Setup is 7537 bytes.
System is 0 kB
/bin/sh: line 1: 10713 Segmentation fault arch/i386/boot/tools/build -b arch/i386/boot/bootsect arch/i386/boot/setup arch/i386/boot/vmlinux.bin CURRENT >arch/i386/boot/bzImage
make[1]: *** [arch/i386/boot/bzImage] Error 139
make: *** [bzImage] Error 2

Voulant en avoir le coeur net j'ai testé avec un 2.6.23.1 vierge, qui n'arrive même pas jusque là :

HOSTCC scripts/basic/fixdep
/bin/sh: line 1: 11377 Segmentation fault scripts/basic/fixdep scripts/basic/.fixdep.d scripts/basic/fixdep 'gcc -Wp,-MD,scripts/basic/.fixdep.d -Wall -Wstrict-prototypes -O2 -fomit-frame-pointer -o scripts/basic/fixdep scripts/basic/fixdep.c ' >scripts/basic/.fixdep.tmp
make[2]: *** [scripts/basic/fixdep] Error 139
make[1]: *** [scripts_basic] Error 2
make: *** No rule to make target `include/config/auto.conf', needed by `include/config/kernel.release'. Stop.

- plus moyen de recompiler mes systèmes FreeBSD (RELENG_6 et RELENG_7), par contre la compilation de l'userland semble fonctionner, même si bien évidemment je n'ai pas vraiment pu tester les binaires générés (et je n'ai plus les logs de compilation, car c'est arrivé il y a deux jours et que je n'y repense que maintenant)

Le reste du système semble fonctionner parfaitement normalement, ce qui inclus des scripts shell simples, firefox et make mrproper dans les dossiers des kernels concernés. J'ai procédé aux tests suivants :

- dmesg, seul truc bizarre mais pas forcément lié : Clocksource tsc unstable (delta = -172269212 ns)
- disque dur avec smartctl -d ata -a /dev/sda
- disque dur avec badblocks /dev/sda
- mémoire avec memtest (memtest86+ v1.70)
- hash MD5 du binaire bash (version 3.1.17(2)-release) en le comparant avec celui du binaire extrait directement du paquet de ma distribution
- réinstallation de bash quand même, au cas où
- changement de sh (/bin/sh -> /bin/ash) : même comportement

Tous ces tests sont donc unanimes : mon système est en parfait état. Le kernel utilisé actuellement est celui fourni par ma distribution, à savoir donc 2.6.21.5-smp.

Quelqu'un aurait il d'autres programmes de diagnostic à me proposer, ou une idée de ce qui pourrait clocher ?
  • # Arf, j'oubliais...

    Posté par  . Évalué à 3.

    J'utilise un portable Acer Aspire, série 5610.

    Je me suis pourtant relu plusieurs fois, parole :(
    • [^] # Re: Arf, j'oubliais...

      Posté par  . Évalué à 2.

      J'ai fait tourner cpuburn (burnP6) pendant deux heures sans problème, par contre burnMMX se fait kill (Killed) dès que je le lance :/
      • [^] # Re: Arf, j'oubliais...

        Posté par  (site web personnel) . Évalué à 1.

        Bon ca m'etonnerait tres fortement mais ton probleme me fait tres franchement pensé que t'ai pas assez de RAM, regarde dans dmesg si apres qu'un processus se soit fait tué t'ai pas un out of memory
        • [^] # Re: Arf, j'oubliais...

          Posté par  . Évalué à 2.

          Nop rien de tel dans les logs, je viens de booter le portable fautif après deux jours d'inactivité (cause week end ;) et j'ai toujours le même problème.
  • # Eurêka !

    Posté par  . Évalué à 4.

    Hier en désespoir de cause j'ai téléchargé tous les BIOS (soit 3) qui trainaient sur le ftp d'acer et je les ai testés, un par un, du plus récent au plus ancien. Mon portable était équipé du BIOS v3.50 flashé il y a plusieurs semaines déjà*. Je n'ai alors constaté aucun souci après avoir flashé le BIOS, j'ai même pu compiler tranquillement un FreeBSD 6-STABLE pour avoir le support de ma carte son (snd_hda).

    Le plus récent étant donc le v3.50, j'ai reflashé mon BIOS avec cette version. Et là au démarrage de ma Slackware, j'ai pu tout compiler tranquillement (à moi les joies du vserver ce soir) ! Moi pas comprendre.

    * : étant donnée ma notion toute relative du temps, çà peut aussi bien être plusieurs mois.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.