S.M.A.R.T corrupto?

Imagen de j0rge1uis
0 puntos

Buen dia a todos, he comprado un disco duro SATA seagate barracuda de 1TB (ATA ST31000528AS). Lo primero que hice fue comprobar los datos S.M.A.R.T del disco para verificar su integridad y me arrojo lo esperado: totalmente nuevo y sin errores.
Procedi a instalar ubuntu 10.04.2 usando el disco entero como /home.
En mi antiguo disco PATA de 160 GB instale el sistema base y deje la swap.
Empece a notar que se frenaba el sistema, asi que revise los mensajes del kernel y constaté que el disco PATA estaba fallando (de hecho desde nuevo me mostraba datos smart erraticos? pero funcionaba muy bien), asi que lo archive.
Ahora instale ubuntu en el disco de 1 TB sin problema alguno. Lo que realmente me preocupa es q el disco ahora tambien me muestra valores erraticos!. aqui les mando la salida de smartmontools:

$ sudo smartctl -l selftest -A /dev/sda
smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 119 099 006 Pre-fail Always - 222933739
3 Spin_Up_Time 0x0003 095 095 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 196
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 927176
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 220
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 98
183 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
184 Unknown_Attribute 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Unknown_Attribute 0x0032 100 096 000 Old_age Always - 6
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 069 063 045 Old_age Always - 31 (Lifetime Min/Max 31/31)
194 Temperature_Celsius 0x0022 031 040 000 Old_age Always - 31 (0 16 0 0)
195 Hardware_ECC_Recovered 0x001a 033 029 000 Old_age Always - 222933739
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 272399710814665
241 Unknown_Attribute 0x0000 100 253 000 Old_age Offline - 823803416
242 Unknown_Attribute 0x0000 100 253 000 Old_age Offline - 1187045168

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 219 -
# 2 Short offline Completed without error 00% 0 -

Nótese como arroja unos valores altisimos.
Acaso el viejo disco me daño el nuevo?
Sera algun malware?
Alguien mas con el problema?

Imagen de j0rge1uis
+1
0
-1

Que es lo que pasa?, esto es muy grave. !!!!!!!!!!!!

+1
0
-1
Imagen de j0rge1uis
+1
0
-1

smartctl version 5.38 [i686-pc-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000f 119 099 006 Pre-fail Always - 223007181
3 Spin_Up_Time 0x0003 095 095 000 Pre-fail Always - 0
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 196
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 932685
9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 221
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 98
183 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0
184 Unknown_Attribute 0x0032 100 100 099 Old_age Always - 0
187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0
188 Unknown_Attribute 0x0032 100 096 000 Old_age Always - 6
189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0
190 Airflow_Temperature_Cel 0x0022 066 063 045 Old_age Always - 34 (Lifetime Min/Max 31/34)
194 Temperature_Celsius 0x0022 034 040 000 Old_age Always - 34 (0 16 0 0)
195 Hardware_ECC_Recovered 0x001a 032 029 000 Old_age Always - 223007181
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 230845902225867
241 Unknown_Attribute 0x0000 100 253 000 Old_age Offline - 824100616
242 Unknown_Attribute 0x0000 100 253 000 Old_age Offline - 1187056977

SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Extended offline Self-test routine in progress 40% 221 -
# 2 Short offline Completed without error 00% 219 -
# 3 Short offline Completed without error 00% 0 -

Lo mas curioso es que la utilidad de discos que trae ubuntu por defecto asume en la casilla estado SMART que el disco esta sano!!
POR FAVOR QUE ALGUIEN ME AYUDE!

+1
0
-1
Imagen de selerto
+1
0
-1

Hola amigo.

Tranquilo, ni yo ni -por lo que dices- la "utilidad de discos" vemos nada que justifique tu alarma.

Exactamente ¿Cuál es el dato que te preocupa?

+1
0
-1
Imagen de Luis Leone
+1
0
-1

Con alguna aplicación para discos,hasta el mismo SMART,"no el de la bios" ,sin que cargue el sistema operativo,lo ideal seria probar el disco en otra Pc,para descartar el motherboard y bios,saludos y suerte.

+1
0
-1
Imagen de j0rge1uis
+1
0
-1

Estos datos son los que me preocupan:

1 Raw_Read_Error_Rate 0x000f 119 099 006 Pre-fail Always - 223007181
2 7 Seek_Error_Rate 0x000f 100 253 030 Pre-fail Always - 932685
195 Hardware_ECC_Recovered 0x001a 032 029 000 Old_age Always - 223007181
240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 230845902225867
241 Unknown_Attribute 0x0000 100 253 000 Old_age Offline - 824100616
242 Unknown_Attribute 0x0000 100 253 000 Old_age Offline - 1187056977

Segun las especificaciones del fabricante estos datos deberian ser de un solo digito, pero aumentan dramaticamente a medida que pasa el tiempo.

Voy a probar el disco en otra pc a ver q datos arroja.

+1
0
-1
Imagen de j0rge1uis
+1
0
-1

El estado SMART del disco es un desastre. Lo he comprobado con seatools DOS boot disk.
Lo mas curioso es que en la prueba larga y la corta de esta utilidad (del fabricante) el disco pasa las pruebas.

Que pudo haber causado tal problema?
Acaso ubuntu daña el SMART? (lo cual dudo mucho)
Acaso algun malware que corrompe el SMART?
Error humano?
Alguien mas tiene este problema?
Agradezco la ayuda dispensada.

+1
0
-1
Imagen de selerto
+1
0
-1

Hola amigo.

Puedo estar equivocado, pero yo apostaría por el "Error humano".

Lo que me parece curioso es que las pruebas que has realizado te dicen que el disco está bien, y de ellas sacas la conclusión que el disco está fatal.

Por lo poco que sé, las pruebas SMART no son 100% fiables por diversos motivos, y los datos obtenidos pueden ser difíciles de interpretar correctamente.

De hecho, los datos preocupantes que mencionas: 1, 7, 195, 240, 241 y 242, a mí no me lo parecen en absoluto.

Por otra parte, según yo los entiendo, 240, 241 y 242 no pueden ser representados con un solo dígito, y que aumenten con el uso del disco es lógico y natural.

+1
0
-1
Imagen de Luis Leone
+1
0
-1

Es simplemente una falla en el programa SMART o la bios con algún problema y repercute en ese programa,lo que haría es actualizar bios,con eso te garantizas el cambio de SMART o cualquier otro problema,saludos.
P.D. No creo que Ubuntu pueda dañar algo fuera de su propio entorno y algo para leer, http://es.wikipedia.org/wiki/S.M.A.R.T.

+1
0
-1
Imagen de j0rge1uis
+1
0
-1

Ante todo gracias por sus respuestas. Espero que mi paranoia sea injustificada, ya que el disco me costo un buen dinero y no quisisera perderlo subitamente tanto por la info con la que pretendo llenarlo, como el valor economico del mismo.

@selerto:
Podrias explicarme por que te parecen normales las lecturas 1 y 7? (240, 241 y 242 creo que tienes razon) Segun lo que tengo entendido esos valores deben ser bajos no? (ademas aumentan aceleradamente) http://en.wikipedia.org/wiki/S.M.A.R.T.#Known_ATA_S.M.A.R.T._attributes
@Luis:
El bios lo actualice hace poco.
P.D. Detalles como este me hacen pensar, claro que sin omitir el beneficio de la duda:
http://www.kriptopolis.org/ubuntu-podria-acortar-vida-disco-duro-portatiles

+1
0
-1
Imagen de selerto
+1
0
-1

Hola de nuevo.

Creo que el error que comentes es centrarte en el valor raw -el número gordo del final- por ejemplo:

1 Raw_Read_Error_Rate 0x000f 119 099 006 Pre-fail Always - 223007181

223007181 te parece mucho. A mí no me parece ni mucho ni poco, en realidad no tengo ni idea de lo que representa ese valor, ni sé cual sería el valor razonable, y me parece que tú tampoco. El hecho de que crezca puede ser tan lógico como en el caso de 240.

Por eso son tan útiles las herramientas de testeo, por que podemos presumir que los creadores de esas herramientas sí saben que representa esa cifra y cual sería la cifra razonable. Sobre todo si los creadores son los propios fabricantes del disco.

Tu solo deberías centrarte en las siguientes cifras: 119 099 006 Según yo lo entiendo...
119 es la estimación de un resultado razonable
099 es el resultado obtenido
006 sería un pésimo resultado

Osea, el resultado obtenido de la prueba (099) está mucho más cerca de lo razonable (119) que de lo pésimo (006). Me parece un buen resultado. Esto no es exactamente así... pero más o menos.

Si te fijas, el valor raw de 1 es el mismo que el de 195
195 Hardware_ECC_Recovered 0x001a 032 029 000 Old_age Always - 223007181

Esto te indica que los errores "1" han sido corregidos sin problemas. Este también es un buen resultado.

Entiendo que la palabra "error" suena... preocupante. Pero en este caso no lo es. Los discos duros están diseñados para cometer errores, por ello cuentan con diversos mecanismos para detectarlos y corregirlos de manera transparente. Te lo explicaré con una parábola:

Yo tengo un secretario que se pasa el día escribiendo documentos importantes. Es fundamental que los documentos no tengan errores ortográficos, gramaticales ni erratas. Para asegurarse de no cometer errores, mi secretario escribe despacio y con mucho cuidado. Esto no me gusta, tenemos mucho trabajo, necesito que escriba mucho y rápido. Entonces le proporciono un editor de textos que es capaz de corregir automáticamente todos los errores que pueda cometer. Ya no nos preocupa que cometa errores (serán corregidos). A partir de ese momento, mi secretario escribirá tan rápido como pueda, tiene que ganarse el sueldo, aun a sabiendas de que cuanto más rápido escriba más errores cometerá.

Más o menos así es como trabaja un disco duro.

Sobre el enlace que pones... es del 26 Octubre 2007. Aun en el caso de ser cierto -no lo sé- si pasados 4 años no lo hubiesen corregido... sería para meterlos en la cárcel por discoduricidio. Sinceramente, te lo digo con cariño, me parece que te estás obsesionando.

Lo cierto es que no tienes por que creerte nada de lo que te he dicho. Pero no veo motivos para dudar del fabricante del disco duro. Hasta donde yo sé, Seagate es un buen fabricante, uno de los principales.

Se me olvidaba, si te preocupan tus datos haz copias de seguridad, si no las haces... después no te quejes.

+1
0
-1
Imagen de furtaxi
+1
0
-1

A menudo, un módulo de memoria defectuoso, provoca errores que se achacan a las unidades.
LiveCd, y memtest, por lo menos, media hora.

+1
0
-1

Mi web : www.vigovideo.es
Buscar es más rápido que esperar una respuesta.