• Apfeltalk ändert einen Teil seiner Allgemeinen Geschäftsbedingungen (AGB), das Löschen von Useraccounts betreffend.
    Näheres könnt Ihr hier nachlesen: AGB-Änderung
  • Viele hassen ihn, manche schwören auf ihn, wir aber möchten unbedingt sehen, welche Bilder Ihr vor Eurem geistigen Auge bzw. vor der Linse Eures iPhone oder iPad sehen könnt, wenn Ihr dieses Wort hört oder lest. Macht mit und beteiligt Euch an unserem Frühjahrsputz ---> Klick

Fehlerhafte Dateien, Festplattendefekt?

skappley

Aargauer Weinapfel
Registriert
09.06.07
Beiträge
745
Ich verliere gerade ein bisschen das Vertrauen in die Technik.

Mir ist es jetzt ein paar mal passiert, dass Dateien einfach ohne ersichtlichen Grund korrupt werden. Ungut ist vor allem, dass ich den Fehler erst bemerke, wenn die Dateien vewendet werden sollen.

Heute gerade passiert mit einer .jar Datei aus einer Java Applikation. Die App startete heute plötzlich nicht mehr und hat Fehler geliefert (gestern ging sie noch, geändert habe ich in der Zwischenzeit nichts). Erst nach einer Weile Sucherei habe ich festgestellt, dass sich die .jar Datei gegenüber jener die in meinem TM Backup lag, geändert hat: Größe blieb auf das Byte genau gleich, auch die Zugriffsdaten ("zuletzt geändert am") haben sich nicht geändert. TM hatte die korrupte Datei heute auch nicht ins Backup übernommen, da OS X von der Änderung nichts mitbekommen hat.

Hab die .jar Datei aus dem TM Backup zurückgespielt und die App lief wieder. Genau das gleiche ist mir vor ein paar Tagen mit Firefox passiert: der lief plötzlich nicht mehr und Abhilfe schaffte nur ihn wieder aus dem TM Backup zurück zu kopieren.

Mein Verdacht viel daher auf meine Festplatte. Habe mir "SMART Utility" zum Auslesen des SMART Status heruntergeladen und dort wird mir als Status der Festplatte "FAILING" angezeigt. Im OS X Disk Utility ist hingegen alles OK - da werden die Werte anscheinend anders interpretiert.

Ich hänge mal an, was dieses SMART Utility ausgelesen hat. Vielleicht kennt sich jemand besser mit diesen Werten aus als ich und kann mir sagen was davon zu halten ist.

Ich plane jetzt natürlich die Festplatte so schnell wie möglich zu ersetzen. Ist übrigens eine Seagate Momentus 7200.4 500GB und eigentlich erst seit kurzem bei mir in Betrieb (ich glaube ich habe sie ca. Mitte März eingebaut), laut SMART hat sie jetzt 1200 Betriebsstunden.

Was mich beunruhigt ist, dass die Dateien so still und heimlich korrupt werden ohne dass es irgendwo erkannt und angezeigt werden würde.

Mich würde interessieren wie man sich am besten gegen solche Fehler schützt und diese möglichst früh erkennen kann. Wisst ihr dazu etwas?

Screen shot 2010-07-28 at 09.57.15.png
Screen shot 2010-07-28 at 09.57.45.png
 

salome

Golden Noble
Registriert
20.08.06
Beiträge
23.750
Hast du schon versucht von der DVD zu starten und mit dem Festplattendienstprogramm die Festplatte zu reparieren?
Nach der Sprachauswahl im Menü oben Dienstprogramme / Festplattendienstprogramm öffnen.
Salome
 

pti'Luc

Westfälischer Gülderling
Registriert
05.07.10
Beiträge
4.600
Das wird nicht viel bringen. Die Platte zeigt eindeutig Fehler, denn sie versucht, defekte Sektoren zu verlagern. Das ist sehr schön auf den beiden angehängten Bildern zu sehen.

Ich rate: schleunigst eine Ersatzplatte besorgen, anschließen (extern oder gleich tauschen), von der Installations-DVD starten und dann alles rüberkopieren bzw. aus dem TimeMachine-Backup wiederherstellen (und dann tauschen - wenn noch nicht geschehen). Von der defekten Platte nicht mehr starten, denn weitere Schreibzugriffe machen es nur noch schlimmer.
 

salome

Golden Noble
Registriert
20.08.06
Beiträge
23.750
Die Platte zeigt eindeutig Fehler,
Und du meinst diese Fehler – defekte Sektoren – können nicht mit dem Festplattendienstprogramm repariert werden?
Sind sie so schwerwiegend?
 

skappley

Aargauer Weinapfel
Registriert
09.06.07
Beiträge
745
@salome

Nein, das hab ich nicht ausprobiert, werde es beim nächsten Neustart mal machen. Mit dem OS X "Disk Utility" habe ich die Festplatte allerdings überprüft, dort wurden keine Fehler gefunden. Arbeitet das Festplattendienstprogramm anders/besser wenn man von der DVD startet?

@pti'Luc

Ja, neue Platte ist schon bestellt und werde ich am Freitag bekommen. Backups habe ich in mehrfacher Ausführung vorhanden, bin also guter Hoffnung, dass ich alle Daten heil auf die neue Platte bekommen werde.


Allgemeine Frage nochmal: wie kann man solche Fehler am besten frühzeitig erkennen? Ich habe keine Ahnung wie lange meine Platte nun schon fehlerhaft ist, schätze aber, dass es bestimmt ein paar Wochen sein werden, da mir in letzter Zeit eben häufiger kaputte Dateien aufgefallen sind. Eigentlich hätte ich früher misstrauisch werden müssen, aber wie gesagt, das OS X Disk Utility zeigt ja sogar jetzt noch an, dass die Platte in Ordnung ist.

Ideal wäre es, wenn das System solche Fehler automatisch erkennen und mich warnen würde... :) Gibt es Tools mit denen das gehen könnte?
 

skappley

Aargauer Weinapfel
Registriert
09.06.07
Beiträge
745
Und du meinst diese Fehler – defekte Sektoren – können nicht mit dem Festplattendienstprogramm repariert werden?
Sind sie so schwerwiegend?

Ich glaube defekte Sektoren sind wirklich defekt (Hardwaredefekt) und nicht reparierbar. Ich kenne das noch von alten Platten aus den 80er Jahren, wo bereits beim Kauf eine Liste von defekten Sektoren aufgedruckt war... :) Damals war es wahrscheinlich noch normal, dass sogar neue Platten bereits ein paar defekte Sektoren hatten.

Wenn Sektoren aber im Betrieb defekt werden, ist das relativ ungut - weil die Daten dann anscheinend unwiderruflich verloren sind. Zumindest scheint es so. Weiß nicht ob sich die Festplatte dann für die Zukunft merkt, welche Sektoren kaputt sind? Erwarten würde ich mir das, leider kenne ich mich diesbezüglich mit der Hardware aber zu wenig im Detail aus.
 

salome

Golden Noble
Registriert
20.08.06
Beiträge
23.750
Arbeitet das Festplattendienstprogramm anders/besser wenn man von der DVD startet?
Du kannst kein Startvolumen reparieren - weil es ja in Betrieb ist. Also musst du von der DVD starten, dann kannst du die Platte reparieren (wenn es denn möglich ist). Ich würde dem systemeigenen Festplattendienstprogramm mehr vertrauen als irgendeinem Tool.
Es gibt ein wunderbares Reparaturprogramm, das das Volumen überprüft und repariert und auch einige andere Putzarbeiten erledigt: Applejack. Es ist nach der Installation nicht sichtbar und funktioniert wie eine Eingabe ins Terminal wenn man im Single User Mode ( + s) startet.
Aber jetzt würde ich es nicht installieren, denn pti'Luc Rat, nichts mehr zu schreiben auf der Platte, ist ein guter.
Allerdings, wenn du alle Daten schon auf einem anderen Volumen gesichert hast, kannst du ja experimentieren.
 
  • Like
Reaktionen: skappley

skappley

Aargauer Weinapfel
Registriert
09.06.07
Beiträge
745
Danke, Applejack habe ich hier im Forum schon mal wo gelesen, aber bisher nicht ausprobiert. Werde ich machen.

Und stimmt, die Daten habe ich an sich gesichert, also kann nicht mehr viel passieren. Morgen muss ich noch arbeiten mit dem Rechner (geht leider nicht anders), und übermorgen bekomme ich die neue Platte. Bevor ich diese einbaue, werde ich noch deine Vorschläge ausprobieren - dann ist es auch egal falls dadurch mehr kaputt werden sollte ;).

Die S.M.A.R.T. Werte müssten eigentlich ja immer die gleichen sein, egal mit welchem Tool man sie ausliest. Die paar defekten Sektoren, die bei mir aufgetreten sind, reichen aber anscheinend für das OS X Disk Utility noch nicht aus, um eine Warnung auszugeben. Müssten wahrscheinlich noch mehr sein?

Ich hab mir übrigens auch die smartmontools installiert, die zeigen noch ein bisschen mehr SMART Daten an. Welche Daten aber hier nun besonders wichtig sind bzw. ab wann ein Wert kritisch ist, weiß ich nicht. Die smartmontools sagen übrigens:

SMART overall-health self-assessment test result: PASSED

Was wie beim OS X Disk Utility heißen müsste, dass die Platte an sich noch OK ist.

Ich füge hier noch ein, was smartmontools über meine Seagate sagt. Vielleicht kann noch jemand etwas dazu sagen.

Code:
mbp:~ gerhard$ smartctl -a disk0
smartctl 5.39.1 2010-01-28 r3054 [x86_64-apple-darwin10.4.0] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Model Family:     Seagate Momentus 7200.4 series
Device Model:     ST9500420AS
Serial Number:    5VJ1QKDR
Firmware Version: 0002SDM1
User Capacity:    500,107,862,016 bytes
Device is:        In smartctl database [for details use: -P show]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Wed Jul 28 20:49:13 2010 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)    Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (  25)    The self-test routine was aborted by
                    the host.
Total time to complete Offline 
data collection:          (   0) seconds.
Offline data collection
capabilities:              (0x73) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    No Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      ( 110) minutes.
Conveyance self-test routine
recommended polling time:      (   3) minutes.
SCT capabilities:            (0x103f)    SCT Status supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   118   099   006    Pre-fail  Always       -       180062399
  3 Spin_Up_Time            0x0003   099   099   085    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       50
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       7
  7 Seek_Error_Rate         0x000f   054   053   030    Pre-fail  Always       -       34361772164
  9 Power_On_Hours          0x0032   099   099   000    Old_age   Always       -       1212
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       209
184 End-to-End_Error        0x0032   100   100   099    Old_age   Always       -       0
187 Reported_Uncorrect      0x0032   001   001   000    Old_age   Always       -       115
188 Command_Timeout         0x0032   100   100   000    Old_age   Always       -       4295032833
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   056   049   045    Old_age   Always       -       44 (Lifetime Min/Max 37/50)
191 G-Sense_Error_Rate      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       0
193 Load_Cycle_Count        0x0032   036   036   000    Old_age   Always       -       129216
194 Temperature_Celsius     0x0022   044   051   000    Old_age   Always       -       44 (0 19 0 0)
195 Hardware_ECC_Recovered  0x001a   043   035   000    Old_age   Always       -       180062399
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       4
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       4
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
240 Head_Flying_Hours       0x0000   100   253   000    Old_age   Offline      -       32624571581708
241 Total_LBAs_Written      0x0000   100   253   000    Old_age   Offline      -       1883657229
242 Total_LBAs_Read         0x0000   100   253   000    Old_age   Offline      -       1703457910
254 Free_Fall_Sensor        0x0032   100   100   000    Old_age   Always       -       0

SMART Error Log Version: 1
ATA Error Count: 87 (device log contains only the most recent five errors)
    CR = Command Register [HEX]
    FR = Features Register [HEX]
    SC = Sector Count Register [HEX]
    SN = Sector Number Register [HEX]
    CL = Cylinder Low Register [HEX]
    CH = Cylinder High Register [HEX]
    DH = Device/Head Register [HEX]
    DC = Device Command Register [HEX]
    ER = Error register [HEX]
    ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 87 occurred at disk power-on lifetime: 1184 hours (49 days + 8 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 8e 35 e6 01  Error: UNC at LBA = 0x01e6358e = 31864206

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 00 10 34 e6 41 00      07:29:40.063  READ DMA EXT
  25 00 00 10 34 e6 41 00      07:29:37.241  READ DMA EXT
  25 00 00 10 34 e6 41 00      07:29:34.566  READ DMA EXT
  25 00 10 a8 1f 4e 40 00      07:29:34.552  READ DMA EXT
  25 00 00 10 34 e6 41 00      07:29:31.850  READ DMA EXT

Error 86 occurred at disk power-on lifetime: 1184 hours (49 days + 8 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 8e 35 e6 01  Error: UNC at LBA = 0x01e6358e = 31864206

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 00 10 34 e6 41 00      07:29:31.850  READ DMA EXT
  2f 00 01 10 00 00 00 00      07:29:31.796  READ LOG EXT
  60 00 00 10 34 e6 41 00      07:29:29.094  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      07:29:29.060  READ FPDMA QUEUED
  60 00 10 c8 a0 4d 40 00      07:29:29.029  READ FPDMA QUEUED

Error 85 occurred at disk power-on lifetime: 1184 hours (49 days + 8 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 8e 35 e6 01

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  60 00 00 10 34 e6 41 00      07:29:29.094  READ FPDMA QUEUED
  60 00 08 ff ff ff 4f 00      07:29:29.060  READ FPDMA QUEUED
  60 00 10 c8 a0 4d 40 00      07:29:29.029  READ FPDMA QUEUED
  60 00 01 d0 c8 75 48 00      07:29:29.028  READ FPDMA QUEUED
  60 00 10 b8 a0 4d 40 00      07:29:29.028  READ FPDMA QUEUED

Error 84 occurred at disk power-on lifetime: 1184 hours (49 days + 8 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 a4 2e e6 01  Error: UNC at LBA = 0x01e62ea4 = 31862436

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 78 58 2e e6 41 00      07:29:23.462  READ DMA EXT
  25 00 78 58 2e e6 41 00      07:29:20.780  READ DMA EXT
  25 00 10 28 d7 0a 40 00      07:29:20.715  READ DMA EXT
  25 00 78 58 2e e6 41 00      07:29:18.019  READ DMA EXT
  2f 00 01 10 00 00 00 00      07:29:17.910  READ LOG EXT

Error 83 occurred at disk power-on lifetime: 1184 hours (49 days + 8 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 a4 2e e6 01  Error: UNC at LBA = 0x01e62ea4 = 31862436

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  25 00 78 58 2e e6 41 00      07:29:20.780  READ DMA EXT
  25 00 10 28 d7 0a 40 00      07:29:20.715  READ DMA EXT
  25 00 78 58 2e e6 41 00      07:29:18.019  READ DMA EXT
  2f 00 01 10 00 00 00 00      07:29:17.910  READ LOG EXT
  60 00 78 58 2e e6 41 00      07:29:15.228  READ FPDMA QUEUED

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Aborted by host               90%      1209         -
# 2  Short offline       Aborted by host               90%      1209         -
# 3  Short offline       Aborted by host               90%      1204         -
# 4  Short offline       Aborted by host               90%      1204         -
# 5  Short offline       Aborted by host               90%      1203         -
# 6  Short offline       Aborted by host               90%      1203         -
# 7  Short offline       Aborted by host               90%      1203         -
# 8  Short offline       Aborted by host               90%      1202         -
# 9  Short offline       Aborted by host               90%      1200         -
#10  Short offline       Aborted by host               90%      1186         -
#11  Short offline       Aborted by host               90%      1179         -
#12  Short offline       Aborted by host               90%      1166         -
#13  Short offline       Aborted by host               90%      1165         -
#14  Short offline       Aborted by host               90%      1156         -
#15  Short offline       Aborted by host               90%      1155         -
#16  Short offline       Aborted by host               90%      1153         -
#17  Short offline       Aborted by host               90%      1147         -
#18  Short offline       Aborted by host               90%      1147         -
#19  Short offline       Aborted by host               90%      1144         -
#20  Short offline       Aborted by host               90%      1142         -
#21  Short offline       Aborted by host               90%      1138         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
 

salome

Golden Noble
Registriert
20.08.06
Beiträge
23.750
Na wenn unterschiedliche Tools unterschiedliche Werte anzeigen, dann arbeiten nicht alle gleich (genau).
Ich kann leider mit den Meldungen nichts anfangen, da müssen Spezialisten her.
Der Fehler 87 bedeutet in der Apple-Fehlerliste: Could not load WDEF.
Aber was WDEF ist, weiß ich auch nicht.
Eine Abkürzungssuche ergibt: Windows Definition (function). Aber auch das kann ich nicht deuten.
:(
 

pti'Luc

Westfälischer Gülderling
Registriert
05.07.10
Beiträge
4.600
Defekte Sektoren sind physikalisch Defekte auf der Platte. D.h. die Sektoren können nicht mehr zuverlässig gelsen und/oder geschrieben werden. Man kann durch einen LowLevel-Format zwar die defekten Sektoren ausgrenzen (die Platte ersetzt sie dann die defekten Sektoren durch einen Verweis auf einen Spare-Bereich, also unbenutzte Sektoren). Oft ist es aber so, dass der Defekt schleichend ist und sich ausweitet. Bei den Preisen für Platten ist es ratsam, die Platten zu tauschen. Als externes Transportmedium lässt sie sich noch verwenden, aber um darauf das Betriebssystem samt sensibler Daten vorzuhalten, wäre mir viel zu unsicher... Derzeit ist die oben genannten Platte für unter 65 EUR zu haben: http://geizhals.at/deutschland/a388980.html
 
  • Like
Reaktionen: skappley

skappley

Aargauer Weinapfel
Registriert
09.06.07
Beiträge
745
Ja, sehe ich auch so - bei den Preisen zahlt es sich kaum aus, sich damit herum zu ärgern und Datenverlust zu riskieren. Auch wenn man die Daten aus dem Backup wieder herstellen kann - Zeit vergeht damit trotzdem ziemlich viel, wie ich heute gemerkt habe.

Wenn die neue Platte eingebaut ist, werde ich mal schauen ob ich für diese Seagate Ersatz bekommen kann (gekauft erst 02/2010, also sogar noch in der Gewährleistungszeit). Falls ja, dann verkaufe ich die Ersatzplatte wahrscheinlich...

@salome

Ich glaube diese Nummern der Fehler sind keine Apple-Fehlernummern, sondern die Platte nummeriert einfach die aufgetretenen Fehler der Reihe nach durch. Insgesamt sind 87 Fehler aufgetreten und die letzten fünf (83 bis 87) hat smartctl vorhin ausgegeben.
 

pti'Luc

Westfälischer Gülderling
Registriert
05.07.10
Beiträge
4.600
Mach es doch anders. Nochmal die Platte kaufen (die ist ja an sich gut) und einbauen... wenn Du dann alles wieder im Gange hast, kannst Du die alte (defekte) löschen und einschicken. Wenn Du den Ersatz bekommst, verkaufe den... spart Dir Arbeit und Zeit.
 

skappley

Aargauer Weinapfel
Registriert
09.06.07
Beiträge
745
Genau so hatte ich es eigentlich vor, ja. War vielleicht nicht ganz eindeutig geschrieben vorhin. Mit "Falls ja, dann verkaufe ich die Ersatzplatte wahrscheinlich", war der Ersatz gemeint, den ich wahrscheinlich aufgrund der Gewährleistung bekomme.

An sich glaube ich auch nicht, dass die Seagate schlecht ist - ich hatte jahrelang sehr viele Seagate Platten und nie Probleme damit. Da mir aber gerade (wie der Zufall es so will...) vor ein paar Tagen auch eine 3,5" Seagate Platte eingegangen ist, wollte ich nun mal einen anderen Hersteller ausprobieren.

Habe mich für eine Hitachi entschieden, da diese ziemlich gute Bewertungen hat, was ich so im Internet gefunden habe. Ist zwar nur eine 5400er Platte, aber scheint trotzdem nicht langsam zu sein. Ein bisschen langsamer als die Seagate zwar, aber das wird mich nicht weiter stören, denke ich.

http://geizhals.at/deutschland/?sr=395062,-1

Außerdem ist das jetzt nur noch eine vorübergehende Lösung, da ich das MBP bald durch einen neuen Rechner ersetzen möchte.
 

salome

Golden Noble
Registriert
20.08.06
Beiträge
23.750
Ich glaube diese Nummern der Fehler sind keine Apple-Fehlernummern,
Da wirst du Recht haben – mit solchen Prüfprotokollen habe ich mich noch nie befasst. Du und pti'Luc, ihr kennt euch ohnehin besser mit den Geheimnissen der Festplatte aus.
 

skappley

Aargauer Weinapfel
Registriert
09.06.07
Beiträge
745
Du und pti'Luc, ihr kennt euch ohnehin besser mit den Geheimnissen der Festplatte aus.

Nein, was mich betrifft, ich kenne mich damit auch nicht sonderlich gut aus. Wie sie funktionieren und ein bisschen Theorie, ja, aber was mit defekten Sektoren passiert, wie da die Fehlerkorrektur abläuft, welche Probleme diese in weiterer Folge verursachen können, das weiß ich auch nicht. Und SMART Daten von Festplatten habe ich heute gerade zum ersten mal näher angesehen, da ich bisher glücklicherweise noch nie solche Probleme hatte. :)


pti'Luc scheint da mehr Erfahrung zu haben. Und wir können immerhin etwas dazu lernen, also auch nicht schlecht :). Was mich nun speziell noch interessieren würde:

pti'Luc, du schreibst, dass bei einer low level Formatierung defekte Sektoren auf gute Sektoren gemappt werden. Wenn das gut geht, dürften danach keine Fehler mehr auftreten? Mal abgesehen davon, dass aufgrund der fehleranfälligen Platte evtl. weitere Sektoren defekt werden könnten. Heißt das aber auch, dass im Moment (also ohne Formatierung), weiterhin Daten in die bereits defekten Sektoren gespeichert werden könnten? Das wäre wirklich schlimm...
 

skappley

Aargauer Weinapfel
Registriert
09.06.07
Beiträge
745
So, jetzt habe ich ein bisschen nachgelesen zum Thema SMART und Teile mal mit, was ich herausgefunden habe:

Gleich vorweg, ganz gut sind die man pages von smartctl (smartmontools) und auch Wikipedia hält einige Infos zum Thema SMART bereit (auch die englische Seite, da steht teilweise mehr als auf der Deutschen):

http://de.wikipedia.org/wiki/Self-Monitoring,_Analysis_and_Reporting_Technology

Das interessanteste für mich, war: wenn Sektoren nicht mehr gelesen werden können erkennt die Festplatte das und merkt sich defekte Sektoren. Erst wenn der nächste Schreibvorgang auf den defekten Sektor durchgeführt werden soll, macht die Festplatte ein remapping und ersetzt den defekten Sektor durch einen Ersatzsektor.

Wie oft das bisher passiert ist steht im SMART Attribut #5 "Reallocated Sector Count" und zwar im "raw value". Demnach trat das bei mir 7 mal auf.

Interessant war dann auch noch, wie man die anderen Werte interpretieren kann:

"value" ist ein Byte (Wertebereich 0-255), das darstellt wie "gut" der "raw value" des jeweiligen Attributs ist. Ein Attribut wird als "failed" markiert, sobald dieser Wert auf oder unter den "threshold" fällt. "value" ist immer der aktuelle Wert, "worst" ist der schlimmste Wert, der für das jeweilige Attribut jemals aufgetreten ist.

Demnach interpretiert meine Seagate die 7 "reallocated sectors" noch nicht als Fehler: value = 100 und threshold = 36. Wie Seagate rechnet, weiß man leider nicht, aber sobald der value auf unter 36 fällt, wäre die Platte für Seagate defekt.

Das erklärt wahrscheinlich auch, warum das OS X Disk Utility noch keinen Fehler anzeigt: ein Fehler würde dort erst gemeldet werden, wenn eines der Attribute wirklich versagt. Das "Smart Utility", das ich gestern auch ausprobiert habe, warnt bereits früher und zeigt jetzt schon "failing" an, was man wohl so interpretieren könnte: die Platte ist dabei, sich schön langsam zu verabschieden.

Bezüglich der "reallocated sectors" habe ich aber auch gelesen, dass dieser Fehler immer einen Defekt oder eine schwächelnde Platte ankündigt. Normalerweise fallen Platten innerhalb von 6 Monaten nach dem ersten solchen Fehler aus. Will man nichts riskieren, ist es also immer eine gute Idee, solche Platten sofort zu tauschen, wie pti'Luc es auch richtig empfohlen hat und wie ich es auch machen werde :).

Sinkt der value auf oder unter den threshold Wert, dann steht ein Ausfall unmittelbar bevor (die Rede ist von 24 Stunden), und man soll sofort sichern was noch geht und die Platte ersetzen.

Edit: es gibt verschiedene Attribut-Typen: "pre-fail" Attribute kündigen einen Defekt an und für diese gilt auch, dass ein Ausfall kurz bevor steht, wenn der threshold unterschritten wird. "old age" Attribute stellen einfach nur die Alterung und Abnutzung des Laufwerks dar: wird der threshold unterschritten, dann heißt das, dass das Laufwerk alt und abgenutzt ist, und deswegen auch ersetzt werden sollte. Es steht allerdings kein Defekt unmittelbar bevor, könnte also auch sein, dass das Laufwerk noch längere Zeit ohne Probleme weiter läuft.

Auf der Wikipedia Seite (vor allem auf der englischen), findet man noch Beschreibungen zu allen Attributen, usw. - dort bekommt man einen guten Überblick.
 
Zuletzt bearbeitet:

salome

Golden Noble
Registriert
20.08.06
Beiträge
23.750
Danke. Du hast das recht gut erklärt. Vielleicht magst du für unser Wiki einen Artikel schreiben.
 

skappley

Aargauer Weinapfel
Registriert
09.06.07
Beiträge
745
Ja, wäre eine gute Idee - zumindest einen Anfang könnte ich dort machen. Die nächsten Tage habe ich leider wenig Zeit, aber ich setz es auf meine TODO Liste.
 
  • Like
Reaktionen: salome

pti'Luc

Westfälischer Gülderling
Registriert
05.07.10
Beiträge
4.600
pti'Luc, du schreibst, dass bei einer low level Formatierung defekte Sektoren auf gute Sektoren gemappt werden. Wenn das gut geht, dürften danach keine Fehler mehr auftreten? Mal abgesehen davon, dass aufgrund der fehleranfälligen Platte evtl. weitere Sektoren defekt werden könnten. Heißt das aber auch, dass im Moment (also ohne Formatierung), weiterhin Daten in die bereits defekten Sektoren gespeichert werden könnten? Das wäre wirklich schlimm...

Es gibt beide Situation:
1. Die Platte ist dann mit den gemappten Sektoren für die Zukunft fehlerfrei, der Fehler beschränkt sich wirklich nur auf die jetzt defekten Sektoren. Keine Ausweitung
2. Der Effekt geht schleichend weiter und es treten neue Fehler auf. Und hie liegt das eine wirkliche Gefahr... so wie Du sie bereits erlebt hat. Plötzlich geht ein Programm nicht mehr oder man kann ein Dokument nicht mehr öffnen.

Deine Erklärung liefert genau dafür dann ja auch den passenden Hintergrund.

Grundsätzlich würde ich eine Platte sofort austauschen, wenn Fehler bereits zu Beeinträchtigungen im System geführt haben!
 

skappley

Aargauer Weinapfel
Registriert
09.06.07
Beiträge
745
Mein System macht mich fertig...

Habe mir am Montag die neue Hitachi eingebaut. Snow Leopard neu installiert und Daten vom letzten TM Backup migriert. Hat alles wunderbar funktioniert und der Rechner lief einwandfrei. Die Platte liefert bei xbench sogar bessere Ergebnisse als die Seagate, obwohl die Hitachi nur 5400rpm im Gegensatz zu den 7200rpm der Seagate hat. Das spricht wohl auch dafür, dass die Seagate in schlechtem Zustand war...

So weit so gut.

Heute Vormittag wollte ich mein Eclipse anwerfen, aber nix da, stattdessen sehe ich seltsame Fehlermeldungen. Im System-Log stand ein Problem mit der classes.jar Datei aus der Java-Installation. Ich schau mir die Datei also näher an und kann's kaum glauben: wieder defekt!

Genau 4096 Byte (1 Sektor) sind falsch/unbrauchbar. Hab dazu einfach wieder die Datei mit dem letzten Backup verglichen. Hier die gekürzte Ausgabe von cmp:

Code:
mbp:Classes gerhard$ pwd
/System/Library/Frameworks/JavaVM.framework/Versions/1.6/Classes
mbp:Classes gerhard$ cmp -bl classes.jar /Volumes/tm_backup/Backups.backupdb/Gerhards\ Computer/Latest/Hitachi500/System/Library/Frameworks/JavaVM.framework/Versions/1.6/Classes/classes.jar
19087361 377 ?    243 ?
19087362 377 ?    166 v
19087363 377 ?     20 ^P
19087364 377 ?     61 1
19087365 377 ?    254 ?
19087366 377 ?     14 ^L
19087367 377 ?    166 v
19087368 377 ?    374 ?
19087369 377 ?    251 ?
19087370 377 ?    357 ?
19087371 377 ?    106 F
[...]
19091449 377 ?    123 S
19091450 377 ?     73 ;
19091451 377 ?    116 N
19091452 377 ?    245 ?
19091453 377 ?     44 $
19091454 377 ?    124 T
19091455 377 ?    256 ?
19091456 377 ?    123 S
Die Datei aus dem Backup zurück kopiert und Eclipse lief wieder.

Besonders super ist jetzt aber: SMART zeigt bei der Hitachi keinerlei Fehler an:

Code:
mbp:~ gerhard$ smartctl -a disk0
smartctl 5.39.1 2010-01-28 r3054 [x86_64-apple-darwin10.4.0] (local build)
Copyright (C) 2002-10 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     Hitachi HTS545050B9A300
Serial Number:    100124PBN40017G0W09E
Firmware Version: PB4OC64G
User Capacity:    500,107,862,016 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 6
Local Time is:    Sun Aug  8 16:05:34 2010 CEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)    Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)    The previous self-test routine completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:          ( 645) seconds.
Offline data collection
capabilities:              (0x5b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    No Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003)    Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01)    Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:      (   2) minutes.
Extended self-test routine
recommended polling time:      ( 158) minutes.
SCT capabilities:            (0x003d)    SCT Status supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   062    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   040    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   144   144   033    Pre-fail  Always       -       2
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       23
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   040    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       78
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       16
191 G-Sense_Error_Rate      0x000a   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       2
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       9114
194 Temperature_Celsius     0x0002   141   141   000    Old_age   Always       -       39 (Lifetime Min/Max 25/48)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0
223 Load_Retry_Count        0x000a   100   100   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%        74         -
# 2  Short offline       Completed without error       00%        70         -
# 3  Short offline       Completed without error       00%        35         -
# 4  Short offline       Completed without error       00%        28         -
# 5  Short offline       Completed without error       00%        24         -
# 6  Short offline       Completed without error       00%        18         -
# 7  Short offline       Completed without error       00%        14         -
# 8  Short offline       Completed without error       00%        12         -
# 9  Short offline       Completed without error       00%        11         -
#10  Short offline       Completed without error       00%        10         -
#11  Short offline       Completed without error       00%         9         -
#12  Short offline       Completed without error       00%         8         -

SMART Selective self-test log data structure revision number 1
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Was kann da los sein? Ich glaube ja fast nicht, dass die Hitachi nun ebenfalls innerhalb kurzer Zeit fehlerhaft ist. Das wäre unglaubliches Pech und wohl auch ziemlich unwahrscheinlich. Ein Software-Problem kann ich mir bei diesem Fehler aber eigentlich auch nicht vorstellen.

Um mich nicht ganz auf SMART zu verlassen, habe ich nach Tools gesucht, mit denen man einen Oberflächen-Scan der Festplatte machen kann. Frei verfügbar habe ich dazu leider nichts gefunden, Drive Genius 3 hat aber gut ausgesehen und kann den Scan auch in einer freien Demo Version durchführen. Habe also diesen Scan ausprobiert und es wurden keine "bad blocks" gefunden (der Scan hat rund 2 Stunden gedauert).

Irgendwelche Ideen dazu?
Ich für meinen Teil kann's kaum erwarten endlich einen neuen Rechner zu bekommen und hoffe sehr sehr stark, dass diese Probleme dann weg sind.