Journal Ben ça c'est pas de bol !

Posté par  (Mastodon) .
Étiquettes : aucune
0
23
mai
2003
Voici ce que je viens de recopier à la mimine après le Nième gel de ma bécanne en 1 semaine. Elle tourne avec une MDk9.1 sur un Lifebook C-1020. Elle est installée depuis 3 mois et n'avait jamais posé de pb, mais depuis 1 semaine, c'est la débandade...
J'ai pas recompilé le noyeau, je comprend pas pourquoi elle se met à planter d'un coup. J'ai pas réussi à identifier d'action précédent systématiquement le plantage. (Quoique si j'en crois mes souvenirs, en prog et en microP, le plantage viendrait de la boucle idle !).

Unable to handle kernel NULL pointer dereference at virtual address 00000000
*pde = 00000000.0.0
Oops: 0000.9.0.0
parport_pc lp parport via82cxxx_audio uart401 ac97_codec sound soundcore nfsd ds yenta_socket pcmcia_core af_packet sr_mod floppy button thermal processor fan ac battery 8139too mii ohci1394 ieee1394 vfat fat supermount sd_mod ide_cd cdrom ide-scsi usb-storage scsi_mod usb-uhci usbcore rtc ext3 jdb

CPU: 0
EIP: 0010:[<00000000>] Not tainted
EFLAGS: 00010246
eax: 00000230 ebx: c03a42a8 ecx: 00000000 edx: 00000000
esi: 00000000 edi: fff7fffe ebp: c037bf18 esp: c037bef8
ds: 0018 es: 0018 ss: 0018
Process swapper (pid: 0, stackpage=c037b000)
Stack: c0124e50 00370000 c012459d c037bf04 c037bf04 00000000 c03a1560 fffffffe
c037bf20 c0121102 c037bf30 c0121014 00000000 00000001 c037bf4c c0120e4a
c03a1560 00000046 c039f900 00000000 c037bf6c c037bf64 c010a486 c03386fc
Call Trace:
[] run_timer_list+0xf0/0x160 [kernel]
[] update_wall_time+0xd/0x40 [kernel]
[] bh_action+0x22/0x50 [kernel]
[] tasklet_hi_action+0x44/0x70 [kernel]
[] do_softirq+0xaa/0xb0 [kernel]
[] do_IRQ+0xb6/0c0 [kernel]
[] call_do_IRQ+0x5/0xd [kernel]
[] acpi_processor_idle+0x158/0x1f3 [processor]
[] acpi_processor_idle+0x0/0x1f3 [processor]
[] acpi_processor_idle+0x0/0x1f3 [processor]
[] cpu_idle+0x42/0x60 [kernel]
[] stext+0x0/0x30 [kernel]

Code: Bad EIP value.
<0>Kernel panic: Aiee, killing interrupt handler!
In interrupt handler - not syncing
  • # Re: Ben ça c'est pas de bol !

    Posté par  (site web personnel, Mastodon) . Évalué à 4.

    Je ne voudrais pas t'éffayer, mais on avait une erreur semblable sur un serveur, plantage aléatoire, sans raison apparente, quelquesoit le noyo. Appel SAV compaq, changeage de la carte mère, et depuis plus de problèmes. Donc si ta machine est encore sous garantie, profites-en, sinon, ben y va falloir casser ta tirelire.
    • [^] # Re: Ben ça c'est pas de bol !

      Posté par  (Mastodon) . Évalué à 1.

      Ben pour la tirelire, c'est pas grave, il est à la boite...
      Par contre, c'est vrai que ça me fait penser à un pb hard car parfois lorsqu'il plante, il faut plusieurs reboot pour arriver à grub (ou même au bios).
  • # Re: Ben ça c'est pas de bol !

    Posté par  (site web personnel) . Évalué à 1.

    Quelques propositions au hasard

    - Essaye de désactiver une majorité d'options dans le bios, dont la gestion d'énergie
    - Regarde s'il n'y a pas des mises à jour pour ton bios
    - essaye de bosser une journée sur une knoppix
    - essaye de tourner sur un noyau 2.2 quelques temps
    - essaye sans l'acpi (avec lilo.conf ou drakboot)
    - essaye de désactiver le dma et d'autres trucs pour les disques dur avec hdparm
  • # Re: Ben ça c'est pas de bol !

    Posté par  . Évalué à 1.

    J'ai déjà eu ce genre de comportement dans le temps. J'ai mis un temps fou à
    découvrir que le ventilo de mon CPU s'arrêtait tout seul de temps à autre. Ça
    pue vraiment le problème de hardware.
  • # Re: Ben ça c'est pas de bol !

    Posté par  . Évalué à 2.

    Par expérience, quand j'ai un problème louche et visiblement aléatoire, je commence par désactiver le Quick POST (Power On Self Test) dans le BIOS afin de tester plus à fond la mémoire.
    Tu peux même aller plus loin en utilisant Memtest http://www.memtest86.com/(...) .
    L'idéal c'est même de changer la RAM si tu as des barettes sous la main.
  • # Re: Ben ça c'est pas de bol !

    Posté par  . Évalué à 3.

    Tu n'a pas recompile le noyeau, mais tu n'aurais pas mis un disque usb ou active le param ide-scsi recement par hasard ?
    Ca ressemble furieusement a un appel de la fonction idle pendant un autre appel IRQ. Une grande specialite de la gestion IDE/emualtion SCSI du noyeau de 2.5.45 a 2.5.69. Comme je sais que MDK a pioche un peu partout pour faire le sien...

    Le truc c'est que pour savoir il faudrait tester avec un 2.5.69 (mais adieu pont IDE-SCSI) ou un 2.4.20(au revoir acpi cherie et FireWire adore) en vanilla.

    kha
  • # Re: Ben ça c'est pas de bol !

    Posté par  (Mastodon) . Évalué à 1.

    Ben G pris mon dd, je l'ai mis dans une autre machine (même modèle), et oh miracle, ça remarche....
    Donc, je pense que la machine va partir rapidement en garantie....

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.