L'inscription de mon premier dos de produit de gestion de S.M.A.R.T. en 1999 pour des dispositifs de SCSI de HP, et ayant NDAs avec très la même chose fabrique mentionné en ce fil car j'ai écrit des connexions pour que leurs OEM interprètent, diagnostiquent, et réparent de divers aspects de santé d'entraînement, m'a laissé ajoutent au mélange.
* S.M.A.R.T. est une technologie prédictive d'échec. Par Spéc., il architected généralement pour te donner la notification de 2$4$ heures du sort malheureux imminent. Les positifs faux et les négatifs non détectés peuvent facilement atteindre plus de 25% de scénarios d'échec, parfois nombres peuvent être beaucoup plus hauts. En d'autres termes, prendre celui qu'il t'indique sous la considération.
* Les algorithmes de S.M.A.R.T. (je l'appellerai maintenant FUTÉ parce que je suis malade du D.O.T.S.) varient près font/modèles et progiciels, et la détection/reportage est profondément différent entre les protocoles d'ATA et de SCSI, ainsi essayera de parler la grande image, pas détail d'adresse à une commande de SATA ou de SAS. Tous les dispositifs ont de diverses mesures pour des choses comme des variations de T/MN et conduisent la taille qui peut changer légèrement et indiquent une condition dégradante. À un certain point, un disque déterminera qu'asse'est assez, et placera un byte de code de peu et d'erreur quand on dit le matériel pour se voter et pour faire rapport. Quelques logiciels inexactement (et ceci est spécifiquement adressé dans Spéc. de norme ANSI en tant que quelque chose ne pas faire) regardent un ou deux métrique et font un appel de jugement que le disque meurt. La chose correcte qu'un réalisateur est censé faire est d'attendre le disque pour vous dire.
* L'exécution diminuée due aux erreurs de CCE et les voies qui ne sont pas lisibles sur la première passe ne sont pas des erreurs FUTÉES, mais conduisent des facteurs de progiciels cette information dans l'algorithme qui détermine si la commande justifie une alerte FUTÉE. On ne peut pas statut FUTÉ de "RESET". Les spécifications de norme ANSI n'ont pas une telle chose. Maintenant, si vous avez un disque qui rapportera qu'un disque a le manqu un essai FUTÉ parce qu'il y a un bloc illisible qui n'a pas été remplacé par un réservé (pièce de rechange), puis vous pouvez remettre à zéro FUTÉ par remapping le mauvais bloc, mais c'est stupide parce que l'unité de disques et le logiciel aiment le spinrite ou celui qui n'a aucune idée si le système de fichiers considère qu'illisible bloquer des données en tant qu'en faisant partie d'un dossier
* Si vous avez un certain SCSI de tard-modèle, SAS, ou des disques de FC, alors il y a un balayage de médias de fond appelé par famille de commande de SCSI. (et bien, les disques d'un certain SATA ont ceci aussi, mais c'est le détail de fournisseur), qui permet des unités de disques individu-propres et la réparation de mauvais blocs à l'arrière-plan pendant le temps à vide. Le logiciel tel que le smartmonux de santools, peut permettre ce dispositif et courir des rapports. La plupart des disques de Seagate SAS/FC/SCSI de tard-modèle te donnent l'instruction de BGMS, mais Hitachi et d'autres donnent ceci aussi bien. Lire le manuel de programmation de l'unité de disques pour voir si elle est là. L'allumer si vous pouvez.
* DANS des environnements de RAID, il va y a une vérification de données, uniformité de données, les médias balayent, ou quelque chose qui lit tous les blocs de toutes les commandes et corrige la parité et récrit de mauvais ou illisibles blocs. FAIRE CECI RELIGIEUSEMENT, UNE FOIS PAR SEMAINE. Ceci forcera le rétablissement des mauvais blocs qui pourraient prendre 5-10 secondes par raie de RAID, si vous avez le matériel bas de gamme. Si vous avez un NetApp ou quelque chose plus chère avec l'entreprise conduit, alors vous n'en verrez pas probablement frapper tandis qu'elle fonctionne.
* Courir la BDC de VÉRIFICATION pour balayer et détecter les blocs récupérables. Est ce ce que les fenêtres fait quand vous courez le scandisk /r, mais avec des fenêtres, il balaye juste une gamme des blocs. /r est la clef, car ceci fait la VÉRIFICATION. Spinrite
* Si vous obtenez une erreur FUTÉE et avez un disque non-OEM (c.-à-d., commande au détail avec la garantie au détail), alors une erreur FUTÉE qualifie pour un remplacement de garantie (si au cours de la période de garantie), ainsi même si l'erreur est une erreur fausse, vous pouvez obtenir la commande permutée dehors. Même est généralement vrai avec les constructeurs d'ordinateurs. Mais si vous achetez vos disques à la friture et ils sont le volume emballé, alors l'oublier. Les numéros de série et les numéros de la pièce sont différents, et l'argent que vous sauf acheter les versions de non-détail représentez le delta des prix d'acheter un disque avec une garantie de 30 jours au lieu d'une garantie de l'an 3-5.
* Les contrôleurs de RAID est une 'discussion entière de nuther, et vraiment les besoins d'être adressée dans le contexte aux réalisations spécifiques, si vous voulez entrer profondément dans lui. Suffire pour dire que le spinrite et le HDDRegen devraient ne généralement jamais être courus sur un membre de RAID à moins que vous connaissiez déjà quels blocs sont le mauvais connu au contrôleur avant que vous commenciez. Autrement quand ils réparent un bloc, il peut très bien corrompre des données sur la raie.