Defekte Aufnahmen - HDD im Eimer?

Wir haben aktuell ein Problem mit dem Board und arbeiten an der Lösung...


-> Aktuell bereiten wir das Upgrade auf die aktuelle Version 6 von Woltlab vor.
  • Hallo miteinander,


    in letzter Zeit machen mir die Aufnahmen mit der Dream ein wenig Sorgen. Immer wieder sind Aufnahmen dabei, die an einer bestimmten Stelle scheinbar kaputt sind. Versuche ich, die Dateien via FTP auf den PC zu ziehen komme ich nur bis zu besagter Stelle. FileZilla bricht die Übertragung dann einfach ab, ein Download übers Web-IF bleibt auch an der Stelle hängen und gibt dann nach ein paar Minuten auf und via Copy/Paste im Windows Explorer wird ein E/A Gerätefehler an der Stelle gemeldet.


    Versuche ich besagte Aufnahmen an der Dream abzuspielen komme ich bis zu der Stelle, dann bleibt alles stehen und es gibt Zahnräder. Irgendwann geht die Aufnahme dann auch einfach aus, als sei sie am Ende angelangt. Hier gibt es aber einen kleinen Trick: Ich kann die Aufnahme von Anfang an laufen lassen und springe dann über die Timecode-Eingabe bis kurz hinter die defekte Stelle. Ab da kann ich dann ganz normal weiterschauen.


    Das erste Mal passiert ist mir das Ganze am 21. September. Da liefen zwei Aufnahmen gleichzeitig - beide waren davon zur gleichen Zeit betroffen. Da dachte ich erst, dass sich die Box vielleicht verhaspelt hat und es nur ein dummer Zufall war. Nur gab es dann in den letzten Wochen immer wieder Aufnahmen, die dieses Problem hatten (auch wenn nur diese Aufnahmen liefen und auch nur dieser Sender eingeschaltet war), was mir so langsam ein wenig Bauchschmerzen bereitet - denn die Box samt HDD sind Anfang Oktober 2 Jahre alt geworden.


    Verbaut ist eine 1 TB HDD von Samsung. Ich habe auch schon vor 2 Wochen die Dateisystem-Überprüfung laufen lassen, die hat auch ein paar defekte Sektoren gefunden und auf die Blacklist verschoben. Da dachte ich aber, dass das die der betroffenen Aufnahmen waren, die noch auf der HDD lagen. Nur hab ich jetzt gerade schon wieder eine Aufnahme von letzter Woche rüberkopiert und die hat auch wieder so einen Fehler.


    Da die betroffenen Aufnahmen alle liefen als ich nicht zu Hause war weiß ich nicht, ob die Box zu diesem Zeitpunkt irgendwelche Auffälligkeiten (Zahnräder etc.) aufwies. Es waren auch sowohl Aufnahmen, die im laufenden Betrieb gemacht wurden als auch Aufnahmen im Idle-Mode betroffen.


    Hat irgendwer noch eine Idee, was ich ausprobieren könnte, um dem Problem auf die Schliche zu kommen? Eine andere 2,5" HDD, die ich einfach mal einbauen könnte, hab ich leider nicht. Aber vielleicht gibt es ja sonst noch irgendeinen Lösungsansatz.


    Danke schon mal für eure Mithilfe!

  • ich würde in dem Fall per Telnet manuell einen filesystemcheck anstossen, da sieht man mehr.


    Die Festplatte mit smartctl überprüfen konnte auch weiterhelfen, falls ein schleichender Hardwaredefekt vorliegt


    Wenn die interne Platte /dev/sda ist:


    smartctl -H /dev/sda
    smartctl -a /dev/sda



    mit smartctl -t short /dev/sda kannst du einen kurzen Selbsttest anstoßen (ca. 2 Min.) mit der Option long dauert es ca. 2 Stunden (die ca. Dauer wird aber ausgegeben)

    Gruß Fred


    Die Dreambox ist tot, es lebe die Dreambox


    Einmal editiert, zuletzt von Fred Bogus Trumper ()

  • Erst mal danke für die Antwort.
    Ich hab jetzt versucht, diesen Schnelltest laufen zu lassen. Allerdings wird da direkt ziemlich viel ausgegeben, womit ich nicht wirklich viel anfangen kann (bin leider absolut kein Telnet-Guru). Was ich sehe ist, dass was von Completet_read_failure (90% left) da steht. Nur in welchem Zusammenhang das jetzt da steht versteh ich nicht so ganz. :winking_face:


    Wie kann ich denn eine Telnet-Ausgabe als TXT speichern? Dann kann ich das Ganze auch mal hier anhängen.

  • Zitat

    Original von Thaddäus Tentakel
    ...


    Wie kann ich denn eine Telnet-Ausgabe als TXT speichern? Dann kann ich das Ganze auch mal hier anhängen.


    per remote vom rechner aus anstarten (telnet oder cmd), nicht direkt auf der box, dann kannst das ganze danach auch per copy + paste rausholen

  • Im Telnetfenster Rechtsklick mit der Maus und markieren wählen. Dann den Text markieren
    und mit Rechtsklick kopieren wählen. Dann kannst du es im Editor einfügen und hier posten.

  • Irgendwie bin ich da zu dämlich für. :grinning_squinting_face:
    Also ich bin bisher immer wie folgt vorgegangen: Ich gehe über das Startmenü von Windows 7 übers Zubehör zur Eingabeaufforderung. Da geb ich dann telnet IP.der.Box ein, logge mich mit root und dem Passwort ein und führe dann die Kommandos aus. Nur bekomm ich die Ausgabe nicht markiert, geschweige denn in die Zwischenablage kopiert.

  • Also direkt ein Problem sehe ich nicht. Nur scheinst du etwas ruppig mit der HDD umzugehen,
    weil der G-Sensor so oft angesprochen hat. Starte jetzt einen Filesystemcheck der Festplatte.

  • Zitat

    Original von Thaddäus Tentakel
    Irgendwie bin ich da zu dämlich für. :grinning_squinting_face:
    Also ich bin bisher immer wie folgt vorgegangen: Ich gehe über das Startmenü von Windows 7 übers Zubehör zur Eingabeaufforderung. Da geb ich dann telnet IP.der.Box ein, logge mich mit root und dem Passwort ein und führe dann die Kommandos aus. Nur bekomm ich die Ausgabe nicht markiert, geschweige denn in die Zwischenablage kopiert.


    bis dahin alles cool


    nur hat win per pefault andere tastenkürzel, schau mal ins menü im telnet


    da steht was crtl+a + ctrl+c is

  • Zitat

    Original von netman
    Also direkt ein Problem sehe ich nicht. Nur scheinst du etwas ruppig mit der HDD umzugehen,
    weil der G-Sensor so oft angesprochen hat. Starte jetzt einen Filesystemcheck der Festplatte.


    Ich hab doch gar nichts schlimmes gemacht. :grinning_squinting_face:
    Das Kommando für den Dateisystem-Check ist doch fsck.ext3 -p /dev/sda1 oder? Das hab ich ausgeführt, nachdem ich die Platte ausgehangen hab. Heraus kommt aber nur das:


    Code
    /dev/sda1: clean, 673/61054976 files, 171392546/244190007 blocks
    root@dm800se:~#


    Eigentlich müsste das doch viel länger dauern und viel mehr da stehen?!

  • versuchs mal so:
    fsck.ext3 -f -v -p /dev/sda1


    dann wird ein filesystem check erzwungen und -v sollte das ganze etwas "gesprächiger" machen. Bei 1TB wäre ein aktiver Swap oder Swapfile kein Nachteil ...


    Dauert dann für 1TB sicher eine Stunde oder gar mehr

    Gruß Fred


    Die Dreambox ist tot, es lebe die Dreambox


  • Zitat

    Original von Fred Bogus Trumper
    versuchs mal so:
    fsck.ext3 -f -v -p /dev/sda1


    dann wird ein filesystem check erzwungen und -v sollte das ganze etwas "gesprächiger" machen. Bei 1TB wäre ein aktiver Swap oder Swapfile kein Nachteil ...


    Dauert dann für 1TB sicher eine Stunde oder gar mehr


    Hab das eben mal angeschubst. Dass das länger dauert ist nicht schlimm, ich brauch die Platte heute Mittag nicht. Allerdings sehe ich in der Telnet-Ausgabe bisher noch gar nix. Mal sehen, ob und wann sich da was tut.

  • Inzwischen hab ich ein Ergebnis:



    Scheint OK zu sein, oder?! Aber wo kommen dann immer wieder diese kaputten Dateien her und kann man die vielleicht doch noch irgendwie retten?

  • Ich würd eine Datei mal durch den TS Doctor jagen.


    Weiss blos net wie und ob das geht wenn die files auf der Box sind. (runter kriegst se ja net, oder geht das in der zwischenzeit?)

  • Zitat

    Original von Brudertuck
    Ich würd eine Datei mal durch den TS Doctor jagen.


    Weiss blos net wie und ob das geht wenn die files auf der Box sind. (runter kriegst se ja net, oder geht das in der zwischenzeit?)


    Auf die Idee bin ich noch überhaupt nicht gekommen! An die Aufnahmen auf der HDD komm ich ja über den Windows Explorer und kann sie dann via Drag & Drop in den TS Doctor ziehen. Das probier ich gleich mal aus.


    EDIT: Funktioniert scheinbar nicht, das Programm hängt sich beim Erstellen der PCR-Liste an der kaputten Stelle auf.

  • Zitat

    Originally posted by Thaddäus Tentakel
    Was ich sehe ist, dass was von Completet_read_failure (90% left) da steht. Nur in welchem Zusammenhang das jetzt da steht versteh ich nicht so ganz. :winking_face:


    Der Selbsttest ist wegen Lesefehler abgebrochen:

    Code
    [...]
    Self-test execution status:      ( 121) The previous self-test completed having
                                            the read element of the test failed.
    [...]
    SMART Self-test log structure revision number 1
    Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
    # 1  Short offline       Completed: read failure       90%      3628         1430217600
    [...]


    Ich kann die Ausgabe nicht so ganz nachvollziehen, da 90% Remaining eigentlich heißt, dass er kaum angefangen hatte, der LBA 1430217600 aber eher bei 73% der Gesamtkapazität liegt. Weiß aber natürlich auch nur Samsung, wie der Test genau abläuft.


    Ich würde sagen, die Platte ist am Abnippeln und Du solltest so schnell wie möglich Ersatz beschaffen und retten, was noch zu retten ist. Die Symptome (auch wenn sie sich nicht in den SMART-Werten widerspiegeln) deuten auf mindestens einen bad spot hin, speziell wenn fsck bad blocks findet und blacklistet sollte man reagieren. Der Kernel bringt sicher bei jedem Zugriff in diese Bereiche bereits Fehlermeldungen - siehe den Befehl dmesg bzw. das Logfile /var/log/messages.


    HTH,
    Andre.