Depuis un moment, ma machine n'arrête pas de me balancer des sig11, SIGSEGV, Segfault ou Segmentation Fault sur des applications spécifiques.
Par exemple, ffmpeg et tout ce qui est basé dessus (mencoder, mplayer, xine, ...), XFree lui même (logout toutes les 0.0001 secondes), neverwinter nights (le client), sound juicer, rhythmnbox, et gcc (pas une compil', kernel ou autre, sans avoir un "internal compiler error" sur un fichier, mais qui passe si je relance make).
Par contre, certaines applications n'ont aucun problème, et c'est épatant. Ça n'est jamais arrivé avec openoffice, wine (!) ou firefox par exemple.
J'ai testé plein de chose, du changement des pilotes nvidia proprios (sans rapport, mais quand on est désepéré...), changement de libc6 (en version expérimental sur debian).
J'ai vu ça : http://www.bitwizard.nl/sig11/(...) et je me suis dit que j'avais peut-être la solution. Mais j'ai changé ma barette mémoire sans que ça n'y change rien.
Je m'oriente donc à contrecoeur vers un problème de carte mère ou de processeur. Lequel? J'aimerais bien le savoir.
Est-ce qu'il y a un truc pour déterminer d'où vient le problème?
# zut
Posté par mickabouille . Évalué à 3.
Allons, rebelotte.
[^] # Re: zut
Posté par khalahan . Évalué à 3.
=> http://linuxfr.org/forums/10/8650.html(...)
# Symptomes ....
Posté par Anonyme . Évalué à 4.
Essaie de décrasser le ventillo.
[^] # Re: Symptomes ....
Posté par mickabouille . Évalué à 3.
Je l'ai fait, ça a fait disparaître les Machine Check Exception.
Mais apparemment, c'étaient deux problèmes différents, puisque l'un a disparu en nettoyant le ventilo (et le radiateur, et tout et tout) et l'autre reste.
[^] # Re: Symptomes ....
Posté par un_brice (site web personnel) . Évalué à 3.
Quels étaient les codes MCE ?
Quel est la tempèrature du processeur (si t'as réussi à faire surchauffer un athlon-xp respect), le nom de carte mère ? La marque des barettes de RAM ?
Tu peut aussi essayer memtest86+, mais d'expèrience il a jamais servi à rien. Un autre test, c'est aussi de tenter un burncpu pour vèrifier s'il augmente le nombre de segfaults. Si oui, tu peut accuser le proc (sans exclure la RAM, malheuresement).
Et puisque ta RAM est neuve, je te prévient d'un problème que j'ai eu : la mienne n'a marché correctement que quand je l'ai overclockée (en diminuant CAS et ses copains).
[^] # Re: Symptomes ....
Posté par cozon (site web personnel) . Évalué à 2.
Pas d'accord, il m'a bien aidé, bien des fois. Par exemple pour expliquer des plantages aléatoires d'un serveur 2003, des erreurs plus ou moins aléatoires à la compilation de kde (quand j'étais gentooiste).
[^] # Re: Symptomes ....
Posté par mickabouille . Évalué à 1.
Mais je ne sais pas si ça peut être d'uen quelconque utilité
Les MCE? Je ne les avais pas noté, mais je viens de me rendre compte en regardant dans syslog qu'ils n'avaient pas complètement disparu. Avant j'avais des non-recoverable, il ne reste que les recoverable, qui sont un peu plus discrets (les autres donnaient un kernel panic - assez bizarrement, je pouvais continuer à faire certaines choses, comme fermer des applis, voire en lancer, et surtout faire des shutdown propres).
kernel: MCE: The hardware reports a non fatal, correctable incident occurred on CPU 0.
kernel: Bank 1: 9400000000000151
Sur google, ça donne beaucoup de réponses du type problème hard, mais moi, ce que je voudrais savoir c'est ça : carte-mère ou proc?
[^] # Re: Symptomes ....
Posté par un_brice (site web personnel) . Évalué à 2.
Status: (-7782220156096216751) Restart IP valid.
Si je comprends le truc correctement (peu probable), le processeur doute de la fiabilité de ses propres registres... donc à priori c'est mauvais signe quand à son état de santé.
T'as pas plus d'infos sur sa température ? Ni sur les voltages ?
Et tu sais pas si un burnK7 augmente plus les segfaults qu'un burnBX ?
De toutes manières je pense qu'on arriveras pas à mieux que des présomptions à l'encontre d'un composant...
[^] # Re: Symptomes ....
Posté par mickabouille . Évalué à 1.
Pour obtenir la température, j'avais installé lm_sensors et ajouté le support I2C, mais les développeurs ne connaissent pas les données des composants VIA et ça annonce une température constante à 127° et des ventilateurs à 10000RPM en continu.
[^] # Re: Symptomes ....
Posté par mickabouille . Évalué à 1.
burnK7 segfault une fois sur deux, l'autre fois j'ai un 255 (erreur de FP/MMX)
burnBX ne segfaulte pas et ne retourne pas d'erreurs.
burnMMX me donne plein d'erreur 254 (erreur sur calcul entier ou erreur d'accès mémoire).
Pas bon du tout. Le processeur est bel et bien brûlé, je pense :(
[^] # Re: Symptomes ....
Posté par Big Pete . Évalué à 1.
Le probléme a disparu en passant la frequence du bus CPU de 133 Mhz à 100, la frequence CPU est passé de 1450 à 1100 et le emerge --update world de 4 cafés à 5
Ca fait pas longtemp que j'ai fait cette bidouille et pour l'instant ça tient, je croise les doigts.
Mais c'était quand même un poil different de toi.
Perso, quand je faisais un emerge ou un burncpu, je voyais la compile planter au bout d'un moment, jamais au même endroit, puis Xmms qui "segfaulter" dans la foulée ensuite X figeait par solidarité et pour finir, c'est la machine qui répondait plus. Jamais rien trouvé dans les logs concernant un plantage du kernel.
Hope this help
Faut pas gonfler Gérard Lambert quand il répare sa mobylette.
[^] # Re: Symptomes ....
Posté par mickabouille . Évalué à 1.
[^] # Re: Symptomes ....
Posté par ahuillet (site web personnel) . Évalué à 2.
"Amusant".
[^] # Re: Symptomes ....
Posté par un_brice (site web personnel) . Évalué à 1.
Peut être qu'un problème de refroidissement est la cause commune à ton premier problème et aux suivants ? Mon dernier problème de processeur vient de ce que mon ventilateur s'arrêtait quand la température devenait trop haute ! (va savoir ce qui pouvais foirer dans la thermorégulation)
Aussi, méfie-toi des cartes mères Asus qui overvoltent le processeur sans prévenir, pour faire plaisir aux jackies.
[^] # Re: Symptomes ....
Posté par Adrien BUSTANY (site web personnel) . Évalué à 4.
[^] # Re: Symptomes ....
Posté par Pooly (site web personnel) . Évalué à 6.
[^] # Re: Symptomes ....
Posté par kd . Évalué à 3.
# re
Posté par LaBienPensanceMaTuer . Évalué à 3.
Suivre le flux des commentaires
Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.