Zombie Invasion

Wir haben aktuell ein Problem mit dem Board und arbeiten an der Lösung...
  • Hi,


    ich bemerke gerade eine zunehmende Zombie-Horde:


    Code
    root@dm800:~# ps | grep Z | grep -v grep | wc -l
    134


    Nach etwas Rumgesuche wird klar:


    Die Zombies werden mehr, sobald die Infobar aktiv ist. Sekündlich. Mit ein paar flott nacheinander abgesetzten ps und etwas gegurke in /proc lässt sich zeigen, dass es Child Processes von /usr/bin/gdaemon sind, die von der HDD Temp Anzeige getriggert werden:


    Code
    3552 root      2532 S    sh -c smartctl -d ata -A /dev/sda 
     3553 root      3920 R    smartctl -d ata -A /dev/sda


    sieht anschließend so aus


    Code
    3552 root         0 Z    [sh]


    und bald sind es wieder ein paar mehr.


    Sieht also aus, als würde gdaemon seine Children nicht ordentlich reapen.


    Code
    root@dm800:~# opkg search /usr/bin/gdaemon 
    geminitools - 0.23-r0


    Mir scheint, dass das neu ist, gestern habe ich das Upgrade auf 0.24-r10 eingespielt. Ich bin aber auch vorhin mal der Empfehlung gefolgt, diverse Caches und Picons auf einen USB-Stick auszulagern, damit ist also noch was anderes geändert worden. Und wenn es um HDD Temp geht, mag die Anwesenheit eines /dev/sdb schon irgendwas beeinflussen können - wenn auch eigentlich nicht das child reaping in gdaemon.


    Sieht das noch jemand?


    Image ist das iCVS vom Februar.


    BTW, hatte nach dem Upgrade gestern beim Reboot nach dem allerersten Bootlogo kein Bild mehr, die Kiste war fast tot aber nicht ganz (Spinner kam noch, Menü ging noch). Nach einem Power Off und 5min Kurzurlaub ging dann aber erstmal wieder alles.


    TIA,
    Andre.

  • Bei mir auch. Das ist nicht normal.


    Code
    root@dm8000:~# uptime   
    14:27:24 up 1 day, 43 min, load average: 0.10, 0.08, 0.08  
    root@dm8000:~# ps | grep Z | grep -v grep | wc -l  
    260  
    root@dm8000:~# opkg search /usr/bin/gdaemon  
    geminitools - 0.23-r0


    Habe "HDD-Temperatur" bzw. "HDD-Temperatur (immer)" unter "BP -> Einstellungen -> Sensorfelder" erst mal ausgeschaltet.
    Hoffe auf Update.

    | DM8000 HD PVR SN:9922... | SAMSUNG HD154UI | GrauTec RGB-TFT | GP3 0.54-r1 (OE1.6) | (eingelagert)
    | DM7080 HD | Transcend SSD370 1TB | GrauTec RGB-TFT v2 | GP3.3 0.83-r2 (OE2.2-stable) | (eingelagert)

    | DM920 ultraHD | Crucial MX500 2TB | DVB-S2X FBC MS Twin | GP4.2 (OE2.5-unstable) |

    Einmal editiert, zuletzt von freebsd-man ()

  • Hat jemand ne Idee?
    Scheinbar klappt was mit smartctl nicht so rund.
    Auch fancontrol2 benutzt "smartctl". Bis zum "01.05.-dvbmodules-BUG" habe ich nix negatives dabei entdecken können. Habe jetzt erstmal fancontrol2 HDD-Temp Abfrage auf "niemals" gestellt.
    (aktuelle Updates iCVS+GP3 von heute)


    Nun aber das hier:
    1. Zahnräder
    2. Box nicht per Fernbedienung ansprechbar.
    3. Syslog spuckt Meldung wegen Cardreader

    Code
    May  2 21:40:04 dm8000 kernel: [ 9102.221000] 9402:221859000 SMCC: iso7816: checksum wrong
    May  2 21:40:04 dm8000 kernel: [ 9102.221000] 9402:221937000 SMCC: iso7816: error in receive


    4. Prozesse für Filterung der Temperatur Werte aus dem smartctl output "klemmen"

    Code
    root@dm8000:~# ps
      PID USER       VSZ STAT COMMAND
    [...]
    9927 root      4484 S    sh -c { smartctl -A /dev/sda | grep "194 Temp" | grep   
    9928 root      5708 S    smartctl -A /dev/sda   
    9929 root      4548 S    grep 194 Temp   
    9930 root      4548 S    grep Always   
    [...]


    5. Prozesse abschiessen hilft bis fancontrol2 wieder auslesen will.

    Code
    root@dm8000:~# kill 9927 9928 9929 9930



    Hier mal weitere Infos:
    Codeschnipsel FanControl2/plugin.py (experimental-git20110503-r0):


    Output von smartctl (5.38-r0):


    BTW: "Hardware_ECC_Recovered" einfach nicht beachten, Platte ist definitiv o.k.

    | DM8000 HD PVR SN:9922... | SAMSUNG HD154UI | GrauTec RGB-TFT | GP3 0.54-r1 (OE1.6) | (eingelagert)
    | DM7080 HD | Transcend SSD370 1TB | GrauTec RGB-TFT v2 | GP3.3 0.83-r2 (OE2.2-stable) | (eingelagert)

    | DM920 ultraHD | Crucial MX500 2TB | DVB-S2X FBC MS Twin | GP4.2 (OE2.5-unstable) |

  • Habe mal wieder für eine Minute den HDD-Sensor eingeschaltet.
    Hier das Ergebnis:
    Die Temperatur der Platte wird mit 30 Grad angezeigt und ich bekomme Zombie Prozesse.



    Die geminitools (0.23-r0) sind bisher nicht upgedated worden. Konnte also kaum etwas anderes erwarten, da ich hier das Problem vermute.


    Jemand eine Idee?

    | DM8000 HD PVR SN:9922... | SAMSUNG HD154UI | GrauTec RGB-TFT | GP3 0.54-r1 (OE1.6) | (eingelagert)
    | DM7080 HD | Transcend SSD370 1TB | GrauTec RGB-TFT v2 | GP3.3 0.83-r2 (OE2.2-stable) | (eingelagert)

    | DM920 ultraHD | Crucial MX500 2TB | DVB-S2X FBC MS Twin | GP4.2 (OE2.5-unstable) |

  • Die Zombies sind weg!


    :hurra:


    Dankeschön.


    Darf ich Dich jetzt "Shaun" nennen?
    Sollten wir uns mal treffen, lade ich Dich auf ein Cornetto ein.

    | DM8000 HD PVR SN:9922... | SAMSUNG HD154UI | GrauTec RGB-TFT | GP3 0.54-r1 (OE1.6) | (eingelagert)
    | DM7080 HD | Transcend SSD370 1TB | GrauTec RGB-TFT v2 | GP3.3 0.83-r2 (OE2.2-stable) | (eingelagert)

    | DM920 ultraHD | Crucial MX500 2TB | DVB-S2X FBC MS Twin | GP4.2 (OE2.5-unstable) |