mrpfiff
Goto Top

Keine RAID Volumes mehr nach Server reboot

Hallo Zusammen,

ich habe eine HP DL380 G6 mit dem integrierten RAID-Controller P410i ich habe den Server am Wochenende neu gestartet.
Nach dem Reboot sagt mir der RAID-Controller jetzt:

HP Smart Array P410i Controller (512MB, v6.64) 0 Logical Drives
"Drive positions appear to have been changed. Run Array Diagnostics Utility (ADU) if previus positions are unknown. Then turn system power OFF and move drives to their original positions."

Im IML bekomme ich folgende Meldung:

"POST Error: 1785-Drive Array not Configured"
"POST Error: 1720-S.M.A.R.T. Hard Drive Detects Imminent Failure"

Es waren aber zwei RAID5 und ein RAID1 konfiguriert es wird jetzt gar kein Volume wird mehr erkannt.

Hat von euch einer eine Idee was hier passiert und wie ich das wieder repariert bekomme?

Danke schon mal um voraus.

Grüße

Pfiff

Content-Key: 482022

Url: https://administrator.de/contentid/482022

Printed on: April 19, 2024 at 03:04 o'clock

Member: maxblank
maxblank Aug 06, 2019 at 08:30:57 (UTC)
Goto Top
Servus,

wichtigsten Fakten vorab, die bisher fehlen:
Aktuelles Backup vorhanden?
Wie wichtig sind die Daten?
Wird das Museumsstück produktiv eingesetzt?
Falls ja, entsteht produktiver Stillstand?
Steht der Server noch unter einem Wartungsvertrag?

Gruß
Maxblank
Member: wellknown
wellknown Aug 06, 2019 at 08:51:07 (UTC)
Goto Top
... würde als erstes mal die Verkabelung prüfen. Und dann ist es unwahrscheinlich dass alle FP gleichzeitig defekt sind, wird wenn es nicht die Verkabelung (oder Stromversorgung) ist der Kontroller defekt sein.
Mitglied: 140447
Solution 140447 Aug 06, 2019 at 09:00:17 (UTC)
Goto Top
Member: killtec
Solution killtec Aug 06, 2019 at 09:33:26 (UTC)
Goto Top
Hi,
wenn du ein Backup hast, kannst du es auch so versuchen, dass du das RAID neu anlegst mit der "alten" config. Mit Etwas Glück ist dann alles sofort da. Hatte so etwas mal bei einem Platten Umzug auf ein neues System, da waren die Daten auch sofort da.

Gruß
Member: MrPfiff
MrPfiff Aug 06, 2019 at 09:50:34 (UTC)
Goto Top
Aktuelles Backup vorhanden? Ja aktuelles Backup vorhanden
Wie wichtig sind die Daten? 2. Exchange DAG Node
Wird das Museumsstück produktiv eingesetzt? Ja ist noch produktiv
Falls ja, entsteht produktiver Stillstand? Aktuell Cluster ist degraded
Steht der Server noch unter einem Wartungsvertrag? Ja Wartungsvertrag bei Drittanbieter
Member: ArnoNymous
Solution ArnoNymous Aug 06, 2019 at 10:37:31 (UTC)
Goto Top
Moin,

so einen Spaß hatte ich mal mit Dell. Da konnte ich mit Hilfe des Dell-Supports die Config des RAID-Controllers wiederherstellen und den Server wieder normal booten, wie killtec ja schon schrieb.
Wenn Support vorhanden sit ,also an HP wenden.

Gruß
Member: maxblank
maxblank Aug 06, 2019 updated at 11:10:33 (UTC)
Goto Top
Zitat von @MrPfiff:

Aktuelles Backup vorhanden? Ja aktuelles Backup vorhanden
Wie wichtig sind die Daten? 2. Exchange DAG Node
Wird das Museumsstück produktiv eingesetzt? Ja ist noch produktiv
Falls ja, entsteht produktiver Stillstand? Aktuell Cluster ist degraded
Steht der Server noch unter einem Wartungsvertrag? Ja Wartungsvertrag bei Drittanbieter

Dann würde ich mich direkt an den Support wenden.
Falls du es selbst machen willst, versuchen ob du leere Raids erstellen kannst und dann das Backup zurück spielen. Vorher, wie hier schon geschrieben wurde, auf Defekte prüfen.
Member: MrPfiff
MrPfiff Aug 06, 2019 at 14:54:00 (UTC)
Goto Top
Ich habe mich jetzt erst mal an den Support gewendet und folgende Rückmeldung bekommen:

https://support.hpe.com/hpsc/doc/public/display?docId=emr_na-c02788292

Das Firmware-Update brachte allerdings keinen Erfolg.

Ich warte jetzt nochmals ab was der Support macht. Dann werde ich die RAIDs neu erstellen und ggf. das Backup zurückspielen. Ich habe allerdings mittlerweile die Vermutung das eben nicht wie gemeldet nur eine Festplatte kaputt bzw. fehlerhaft ist.
Member: haifisch1896
haifisch1896 Aug 06, 2019 at 14:57:41 (UTC)
Goto Top
Haben die Platten in etwa selbea Alter und selbe Laufzeit? Dann kann schonmal passieren, dass die kurzfristig hintereinander ausfallen.
Weißt Du, welchen Smart-Fehler der Controller meldet?
Mitglied: 140447
140447 Aug 06, 2019 updated at 15:19:43 (UTC)
Goto Top
Link oben hast du gelesen und die dort geschilderte Lösung ausprobiert?
Member: maxblank
maxblank Aug 06, 2019 updated at 15:22:13 (UTC)
Goto Top
Firmware updaten ist ja gut und schön, trotzdem sollte kein HPE-Server die RAID-Config von 3 Raids nach einem Neustart gleichzeitig verlieren.

Kannst du über das iLo mehr zu den Systemwerten des Controllers bzw. der Platten sehen?
Was sagt da das Log?
Member: MrPfiff
MrPfiff Aug 08, 2019 at 14:45:34 (UTC)
Goto Top
@140447

ja den Link habe ich gesehen und hatte ich auch ausprobiert. Hatte leider keinen Erfolg. Trotzdem danke

@maxblank

Nein im iLO finde ich auch keine neuen/anderes Meldung wie die POST-Meldungen. Im iLO2 gibt es leider nicht so viele Informationen.
Platten meckert er nur eine an die er auch beim POST anmeckert

Heute morgen hatte ich nochmal Termin mit dem Support. Dieser hat noch in der Controller-CLI etwas probiert was leider auch keinen Erfolg hatte.

Ich habe jetzt die RAID-Volumes neu erstellt. Nur ein RAID5 Volume hat jetzt nicht mehr funktioniert (Was ich aber aus dem Backup wiederherstellen kann). Das RAID1 Volume und das andere RAID5 Volume wurden von Windows sofort erkannt.

Es bleibt auf jeden Fall sehr komisch und keiner kann sich so recht erklären was da falsch gelaufen ist. Aber es zeigt auch wieder wie wichtig Backups sind face-smile
Member: maxblank
maxblank Aug 08, 2019 at 17:49:41 (UTC)
Goto Top
Dann tausche die defekte Platte aus, Backup drauf und das ist der Fall gegessen. 👍