MD und kaputte Platten

Der Admin legt ein paar MD RAID1 Gruppen an und dann passiert es: Eine Platte geht kaputt. So kaputt, dass Linux das Device entfernt. Aber warum sollte es das den MD-Devices mitteilen? Dort ist eine failed disk Teil der Gruppen, die man jetzt nicht mehr entfernen kann, weil es sie ja nicht mehr gibt. Reboot tut gut, anders wird man den Zustand nicht los.

Sollte es sich die defekte Platte überlegen und wieder am SATA-Bus erscheinen, dann bekommt sie einen neuen Namen, d.h. sdc wird wegen Defekt entfernt und dafür erscheint die gleiche Platte danach als sdm – sdc bleibt verschwunden – bis zum nächsten Reboot.

Sicher, Platten sollten sowas nicht tun, aber wenn der Drecksgeier schon Devices entfernt, statt jeden Zugriff mit EIO zu beantworten, dann sollte er es komplett tun.

Leave a Reply

WordPress Appliance - Powered by TurnKey Linux