Retour : Page Principale > sommaire mémos
Il s'affiche un paragraphe d'information pour chaque disque physique (PD) , commençant par "PD: i Information" où i prend les valeurs 0, 1, 2 etc. successivement.
Le disque défectueux est celui pour lequel aucune information n'est affichée (source: http://www.mostlychris.com/blog/2009/07/29/check-raid-status-with-megacli/).
Dans l'exemple ci-dessous c'est le disque 1.
TODO : installer une alerte sur problème raid. => Fait :
Notes suite Ă l'intervention du 9 octobre 2017 :
Le RAID système d'Agathis était dégradé. (Agathis compte deux RAIDs, un RAID1 pour le système et un RAID5 pour le stockage)
Un des deux disques en RAID 1 avait lâché (Firmware State : Failed). Ces disques systèmes ne sont pas accessibles depuis la façade, il faut ouvrir le capot du haut.
Le technicien a procédé au remplacement du disque à chaud, sans éteindre la machine.
Les disques d'origine étaient de 146Go; en comptant celui d'aujourd'hui, les deux ont été remplacés par des 300Go.
Le voyant orange susceptible d'indiquer une défaillance de disque est étrangement resté bleu, du moins jusqu'à ce qu'un disque soit déconnecté.
Procédure en cas de problème avec le RAID des disques
Documentation Megacli :
http://tools.rapidsoft.de/perc/perc-cheat-sheet.pdfCommandes de base :
- MegaCli64 -AdpAllInfo -aALL : toutes le log sur le Raid. Rechercher la chaine Degraded : 1 pour détecter un problème.
- MegaCli64 -AdpAlILog -aALL > /tmp/MegaCli.log.txt: pour exporter le log complet du RAID
- MegaCli64 -PDList -aALL : pour visualiser l'état des unités disques. Rebuild indique une reconstruction en cours, Online un fonctionnement normal.
- MegaCli64 -PDList -aALL | grep 'state\|Device Id': Pour afficher les identifiants des disques et l'état
- MegaCli64 -LDInfo -Lall -aALL : pour visualiser le type de RAID pour le volume
Pour trouver le disque physique qui pose problème :
- MegaCli64 -LDPDInfo -aAll
Il s'affiche un paragraphe d'information pour chaque disque physique (PD) , commençant par "PD: i Information" où i prend les valeurs 0, 1, 2 etc. successivement.
Le disque défectueux est celui pour lequel aucune information n'est affichée (source: http://www.mostlychris.com/blog/2009/07/29/check-raid-status-with-megacli/).
Dans l'exemple ci-dessous c'est le disque 1.
root@sequoia:~# MegaCli64 -LDPDInfo -aAll
Adapter #0
Number of Virtual Disks: 1
Virtual Disk: 0 (Target Id: 0)
Name:
RAID Level: Primary-1, Secondary-0, RAID Level Qualifier-0
Size:285568MB
State: Degraded
Stripe Size: 64kB
Number Of Drives:2
Span Depth:1
Default Cache Policy: WriteBack, ReadAheadNone, Direct, No Write Cache if Bad BBU
Current Cache Policy: WriteThrough, ReadAheadNone, Direct, No Write Cache if Bad BBU
Access Policy: Read/Write
Disk Cache Policy: Disk's Default
Number of Spans: 1
Span: 0 - Number of PDs: 2
PD: 0 Information
Enclosure Device ID: 32
Slot Number: 0
Device Id: 0
Sequence Number: 2
Media Error Count: 0
Other Error Count: 0
Predictive Failure Count: 0
Last Predictive Failure Event Seq Number: 0
PD Type: SAS
Raw Size: 286102MB [0x22ecb25c Sectors]
Non Coerced Size: 285590MB [0x22dcb25c Sectors]
Coerced Size: 285568MB [0x22dc0000 Sectors]
Firmware state: Online
SAS Address(0): 0x5000c5000ef3a209
SAS Address(1): 0x0
Connected Port Number: 0(path0)
Inquiry Data: SEAGATE ST3300656SS HS093QP0GVZ5
Foreign State: None
Media Type: Hard Disk Device
Device Speed: Unknown
Link Speed: Unknown
PD: 1 Information
Exit Code: 0x00
Notes :
Il a fallut 45mn, une fois le disque raid remis, pour que MegaCli64 indique un statut Degraded : 0 . Les voyants sur le disque indiquaient pourtant un fonctionnement normal.TODO : installer une alerte sur problème raid. => Fait :
/usr/local/sbin/check-raid 1
Notes suite Ă l'intervention du 9 octobre 2017 :
Le RAID système d'Agathis était dégradé. (Agathis compte deux RAIDs, un RAID1 pour le système et un RAID5 pour le stockage)
Un des deux disques en RAID 1 avait lâché (Firmware State : Failed). Ces disques systèmes ne sont pas accessibles depuis la façade, il faut ouvrir le capot du haut.
Le technicien a procédé au remplacement du disque à chaud, sans éteindre la machine.
Les disques d'origine étaient de 146Go; en comptant celui d'aujourd'hui, les deux ont été remplacés par des 300Go.
Le voyant orange susceptible d'indiquer une défaillance de disque est étrangement resté bleu, du moins jusqu'à ce qu'un disque soit déconnecté.