Journal à la recherche du materiel parfait

Posté par  (site web personnel) .
Étiquettes :
0
7
mai
2007
Salut journal,

Je cherche à remplacer une partie de mon matériel informatique.

Pourquoi ? Parce qu'une suite d'événement plus ou moins bizarres, survenue récemment, me fait douter de la fiabilité de ce matériel, sans pouvoir en identifier précisémment la cause.

En 2 mots, j'ai constater des corruptions de fichiers, corruptions ayant entrainé la dégradation de nombreuses photos ( c'est la conséquence la plus visible ), et autres fichier système, jusqu'à rendre le système particulièrement mal en point ( dysfonctionnements divers, refus de booter, etc ...).

Par exemple, apt a soudainement cessé de fonctionner en me signalant une erreur de syntaxe dans /var/lib/dpkg/status. Après vérification, ce fichier contenait effectivement une ligne de caractère non-ascii, dont la suppression a permis à apt de fonctionner de nouveau...

Bien évidemment, mon système de sauvegarde s'est empressé de sauvegarder ces données corrompues, donc échec. ( Mon prochain système de sauvegarde tentera de répondre à cette problématique, en me donnant la possibilité de garder plus de 2 semaines d'historique... mais c'est une autre histoire ).

Donc histoire d'être tranquille, j'envisage de changer l'ensemble carte mère, memoire, disquedur et cpu, voire de changer la totale, si ça vaut le coup.

Mon pc étant mon principal outil de travail, j'ai besoin de quelque chose de **stable**, et bien sur de "full linux compliant", quitte à sacrifier un peu de performance. Les applications les plus gourmandes que je puissent avoir à lancer sont virtualbox ( 2 instances max ), openoffice et epiphany. Le reste, c'est xterm, vi et ssh...

Après quelques recherches sur internet, je n'ai rien trouvé de concluant. J'ai découvert par hasard keynux, mais ça fait un peu cher pour l'instant, et après vérification leur linux sont "modifiés" pour pouvoir tourner sur leur matériel, donc à moins d'utiliser leur systeme, il y a des risques de galère ( et je n'ai plus l'age de passer mes nuit à bidouiller mon pc ).

Connaissez vous des marques, revendeurs pro-linux, ceux à éviter, etc ?

Pour les lyonnais: connaissez-vous un assembleur sympa, et pro linux dans cette ville ?

Merci !
  • # Mémoire défectueuse

    Posté par  (site web personnel) . Évalué à 3.

    Tu as visiblement des problème de corruption mémoire.
    Une bonne protection contre ce genre de problème est la mémoire ECC

    Pour la stabilité, il faut adopter un machine dans les gammes "station de travail".
    C'est à base de Xeon ou d'Opteron. C'est bien construit, bien ventilé, mais aussi plus cher, mais pas nécessairement hors de prix.

    Voir par exemple
    Dell Precision 490
    HP xw6400
    • [^] # Re: Mémoire défectueuse

      Posté par  (site web personnel) . Évalué à 4.

      Tu as visiblement des problème de corruption mémoire.
      Ouaip. Commence par faire un petit memtest pour t'en assurer : http://www.memtest.org/
    • [^] # Re: Mémoire défectueuse

      Posté par  . Évalué à 3.

      Lors de corruption, les yeux se tournent évidemment vers la mémoire du pc.
      Mais, sans pouvoir expliquer le lien de cause à effets. J'ai eu des problèmes simillaires : corruption de fichiers dont la base du gestionnaire de paquets, des erreurs de boot, des redémarrages inopinés ... etc. Et si aprés des mois de galère a soupsonner la mémoire, le disque dur, puis la carte mère, mon alimentation n'avait pas lâchée, je n'aurai jamais soupçonnée qu'elle était à l'origine de tous.
      • [^] # Re: Mémoire défectueuse

        Posté par  . Évalué à 3.

        meme commentaire sur un des blogs traitant de zfs.
        Le systeme de somme de controle a permis a un admin de découvrir une corruption silencieuse. En remontant il a trouvé que l'alim était en cause.

        pour ma part j'ai perdu 2 de mes dd à 3 mois d'intervalles. J'ai 'décidé' que c'était l'alim (bruit bizarre, non stabilité, ...).
        Depuis j'ai acheté une alim de bon niveau (et silencieuse!) et aucun probleme. (alors qu'avant un de mes dd avant du mal a revouloir booter).
      • [^] # Re: Mémoire défectueuse

        Posté par  (site web personnel) . Évalué à 4.

        Ça peux venir du processeur aussi.

        J'ai eu un amd 2100+ qui avait "chauffé" et une des unités de calcul devait avoir un soucis.

        Plantage hard régulier, corruption tout azimut, etc...
      • [^] # Re: Mémoire défectueuse

        Posté par  (site web personnel) . Évalué à 2.

        Je conseille aussi de tester le disque dur, avec les outils fournit par le constructeur. En général, c'est une disquette bootable avec ce qu'il faut dessus. Lorsque j'achète un disque, il y passe plusieurs fois entre deux remplissages complets et au bout d'une semaine, c'est bon pour la prod. Ensuite, un test par an. La seule marque avec laquelle j'ai jamais eu de soucis en 5 ans, c'est Seagate (avec un PC Dell).
  • # carte-mère

    Posté par  . Évalué à 1.

    pour ma part, j'avais aussi des pertes de données, quelques bits par millions.
    - apres avoir fait du checksum sur des gros volumes de données sur une machine saine et sur cette maudite machine,
    - apres aussi avoir fait un test memoire sans vraiment un retour positif,

    j'en ai déduit que des bits "se perdaient" entre le disque dur et le processeur. J'ai retrouvé une ancienne carte-mère pour Duron. Et maintenant cette machine marche à nouveau, enfin ce qu'il en reste. J'ai reconstitué une nouvelle machine avec différentes pieces de mon petit patrimoine informatique.

    Le test consiste en gros à répéter cette opération :

    cd /spare/dvd/
    find . -name *.mpeg | xargs md5sum > fichier.txt
    md5sum fichier.txt

    le dernier md5sum doit toujours être le même. Si ce n'est pas le cas voir au niveau :
    - du disque dur
    - de la memoire
    - du processeur
    - de la carte-mère pour finir.
    • [^] # Re: carte-mère

      Posté par  (site web personnel) . Évalué à 2.

      Ce matin, j'ai lancé la commande suivante:
      find /srv -type f -exec md5sum {} \; > srv.md5

      Je viens de lancer une vérification:
      md5sum -c srv.md5,

      et j'ai obtenu des erreurs.

      Le plus étrange, c'est qu'en lançant cette vérification plusieurs fois, j'obtiens un nombre
      variable d'erreur ! ( un coup j'en ai 3, un coup j'en 7, puis ça revient à 4 ).

      Que dois-je conclure de ces résultats ? ( à part qu'il devient urgent de mettre mes données à l'abri )...
      • [^] # Re: carte-mère

        Posté par  . Évalué à 1.

        quel honneur d'avoir utilisé ma methode de test. Maintenant, si tu le peux, i lfaudrait vérifier si c'est ton disque qui fait des cauchemars. Et si possible eviter d'écrirer dans les partitions ou tu as des données précieuses.

        L'ideal dans ce cas est d'avoir 2 ordinateur ou 2 disques durs et deja de mettre ses données en lieux sur. Et attention, tu ne peux pas garantir qu'un CD/DVD de sauvegarde soit valide avec ta configuration actuelle.

        je me demande si tu ne touche pas du doigt a l'informatique quantique, celle qui ne donne pas toujours le meme resultat en fonction du temps ... hihihihi.
      • [^] # Re: carte-mère

        Posté par  . Évalué à 3.

        j'avais pas vu ton pseudo, ne t'etonne plus !
        • [^] # Re: carte-mère

          Posté par  (site web personnel) . Évalué à 2.

          j'avais pas vu ton pseudo, ne t'etonne plus !

          +1

          Ceci dit, j'avais un disque ide sur cette machine. j'ai lancé des tests dessus et je n'ai constatée aucune défaillance.

          Conclusion ( j'espère définitive ):
          Je me suis acheter un disque dur sata flambant neuf. J'ai réinstallé mon système, récupéré mes pauvres données, et lancer quelques tests. Pour le moment ça roule, les problèmes semblent bien venir des disques.

          Je vais faire des md5 réguliers pour confirmer ça.
  • # Problème de disque dur ?

    Posté par  (site web personnel) . Évalué à 2.

    Regarde du côté des smartmontools qui te permettent d'avoir des statistiques des erreurs du disque de dur.
  • # Biais

    Posté par  . Évalué à 1.

    La matériel parfait existe-t-il ?
    • [^] # Re: Biais

      Posté par  (site web personnel) . Évalué à 1.

      Le matériel parfait existe-t-il ?

      Sans doute pas ;)

      J'en suis à l'idée que pour ne pas avoir de soucis, il me paraît plus simple de remplacer mon matos informatique à neuf tous les 2 ans. ( bonjour l'environnement... )
      • [^] # Re: Biais

        Posté par  . Évalué à 2.

        Ce qui est neuf a plus de chances de péter que ce qui l’est moins. En gros : soit ça pète rapidement (quelques semaines), soit ça tient assez longtemps (quelques années. Et ça dépend du matériel (ex. bidons : alim. = 4 ans, disque = 3 ans…), donc il faut remplacer partie par partie, suivant l’usure.
  • # Alimentation défectueuse ou faible

    Posté par  . Évalué à 2.

    Un grand classique, c'est le défaut d'alimentation.

    La RAM actuelle est très sensible aux chutes de tension; et parfois le contenu est corrompu alors que la carte mère, chargé de surveiller la tension et d'agir en cas de problème; ne voit rien.

    Il y a eu une discussion il y a quelques mois chez les développeurs Linux signalant que souvent; en cas de coupure de courant sur des cartes mères bas de gamme; il arrivait qu'un transfert DMA en cours vers un disque dur se termine sans que la carte mère se rende compte que les données étaient corrompues. Le secteur écrit sur le disque dur au moment de l'extinction était donc complètement corrompu.
  • # Merci...

    Posté par  (site web personnel) . Évalué à 1.

    ... pour vos réponses.

    Au final, j'ai racheté un disque dur, remis dessus ce qui me restais de donnée. Je pense remplacer aussi l'alimentation, "just in case".

    Je suis en train de mettre en place tripwire, afin de prévenir tout rsique de corruption future.

    Merci

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.