Forum général.cherche-logiciel SSD , fiabilité et logs

Posté par  . Licence CC By‑SA.
Étiquettes : aucune
2
28
déc.
2013

Bonjour,

Comme pour chaque histoire de disque endommagé je pose les questions lorsqu'il est déjà trop tard mais voici le récit de mes mésaventures :

Hier matin, mon dédié chez OVH est subitement devenu indisponible. Je pinguais mais pas de SSH ou de HTTP. En SSH j'obtenais le prompt du password 1 fois sur 10 et après cinq minutes d'attente puis plus rien. Finalement après moult redémarrages et désactivation de services (openvpn, transmission, …) le support OVH m'envoie un email pour me dire que mon disque est endommagé et qu'ils vont le changer donc de bien vouloir sauvegarder mes données.
Seulement voilà, à aucun moment smarctl ne m'a averti du danger ! OVH a un système assez poussé de monitoring des disques et jusqu'à la fin tous les voyants étaient au vert. Bref, je sauvegarde ce qui peut l'être et j'attend (jusqu'à maintenant) l'intervention des techniciens pour remplacer le disque.

Et puis, loi des séries oblige, hier soir le SSD de mon laptop (un Crucial V4 de moins d'un an) s'est mis à m'injurier dans les logs de systemd à coup de :

ata1.00: status: { DRDY ERR }
ata1.00: error: { UNC }

D'après Google il est bien en train de mourir et en voulant le sauvegarder avec fsarchiver j'ai constaté que plusieurs fichiers étaient tronqués. Et comme pour mon dédié tous les tests de smarctl m'affirment que tout va bien. J'avais pourtant appliqué les recommandations de https://wiki.archlinux.org/index.php/Solid_State_Drives (swappiness, TRIM, …)

D'où mes deux questions :
- Y-a-t'il une marque ou un modèle de SSD plus fiable que les autres ?
- Avec le passage à systemd, quel moyen, outil, existe pour surveiller les logs du noyau et alerter en cas d'erreur de disque ?

Merci d'avance.

  • # pas de chance

    Posté par  . Évalué à 1.

    je dirais que c'est la faute à pas de chance,

    j'ai un SSD de 32Go depuis 2008 (mince bientot 6 ans)
    il a servi avec un windows XP et Office 2003 (ca ramait sous outlook qui faisait plein de petit acces)

    puis il a servi sous linux dans ma machine de boulot, 8h/jours pendant plus d'un an
    depuis il a servi 3 ans dans mon pc desktop,
    et là il a été reconvertit en disque Systeme pour mon serveur VMware 5.5

  • # Statistiques SAV

    Posté par  (site web personnel) . Évalué à 5.

    Statistiques de retour SAV :
    http://www.hardware.fr/articles/893-7/ssd.html

    Et sinon, un outil bien utile pour tenter de récup un max de data d'un disque en train de mourir :
    http://safecopy.sourceforge.net/

  • # j'en utilise

    Posté par  . Évalué à 4.

    plus de 200 déployer sur plein de serveur, et je dois dire que pour éviter les soucis il faut y mettre le prix + gamme industriel.

    a force d'en demonter pour controler les references de composant et lire la doc du constructeur sur ce composant, il semblerait que le controleur soit un element vital. Par exemple pour kingston c'est un composant standard sur de la memoire samsung, et pour innodisk c'est leur contrôleur propre sur des mémoire micron. J'ai du remplacer l'ensemble des kingston.

    Sinon smartctl ne m a jamais aider pour découvrir un souci sur des SSD.

    • [^] # Re: j'en utilise

      Posté par  . Évalué à 2.

      Sinon smartctl ne m a jamais aider pour découvrir un souci sur des SSD.

      Et qu'est-ce qui t'a aidé ? Tu utilises quoi pour surveiller tes disques ?

      • [^] # Re: j'en utilise

        Posté par  . Évalué à 1.

        comme je ne peut pas faire confiance a smartctl, je fais plus confiance au retour clients sur des soucis reseau ou autre probleme qui apparaisse au fur et a mesure.

        au début, je dépannais par téléphone leur configuration + changement du SSD a la fin, maintenant je fais changer directement le SSD.

        sinon le datasheet du composant (memoire) a l'interieur du SSD donne pas mal d'indication sur la durée de vie.

Suivre le flux des commentaires

Note : les commentaires appartiennent à celles et ceux qui les ont postés. Nous n’en sommes pas responsables.