Commencer une nouvelle conversation

Non résolu

S

1 Rookie

 • 

28  messages

33

15 mai 2025 20:06

Suspicion de BBU morte (R710)

Bonjour a tous, depuis un très bon moment, mon R710 me dis que ma BBU a un soucis. 

sa spam en boucle "The storage battery has failed." et "The storage battery is operating normally."

Mais... qu'il me le spam, c'est étrange. 
et j'ai fait un p'tit MegaCli en checkant la BBU, et... 

j'crois avoir trouvé un soucis. 

c'était ceci: 


les lignes qui m'inquiète sont: 
"Relative State of Charge: 9 %"
"Absolute State of charge: 7 %"
"Date of Manufacture: 08/15, 2013"
"Battery State: Degraded(Need Attention)
                A manual learn is required."
"Charger Status: Unknown"
"Remaining Capacity: 123 mAh"
"Full Charge Capacity: 1402 mAh"
"Cycle Count: 47"

Pourquoi a 47 cycles, elle meurt? 
je suspecte qu'elle n'as jamais été utilisée, et qu'en 12 ans, elle a eu le temps de mourir. 
ce qui cause que mon RAID-5 a un débit Dégueulasse a en mourir (genre pire qu'un HDD en IDE so années 90, ou le début du SATA 1.5Gbps)
des fois il fais ses 500/600MB/s, et des fois il atteint 15MB/s. voir en dessous. 

Je sais que mon R710 n'est plus en garantie depuis le 13 Octobre 2015, mais c'est juste une confirmation si j'dois chialer ou rire. (chialer si elle est morte, ou rire si elle est juste conne)

Si vous avez une piste, j'suis preneur :)

Moderator

 • 

3.5K  messages

16 mai 2025 13:14

La BBU du R710 approche de sa fin de vie et a un impact sur les performances du RAID 
Vos soupçons sont certainement fondés. La sortie MegaCli indique fortement que l'unité de sauvegarde par batterie (BBU) du contrôleur RAID de votre Dell R710 est en train de tomber en panne à cause de l'âge, et c'est la cause probable de vos performances RAID-5 erratiques.
Voici un aperçu des signes inquiétants de votre sortie MegaCli :
 * "État de charge relatif : 9 %" et "État de charge absolu : 7 %" : Ces niveaux de charge extrêmement bas indiquent que la batterie ne peut plus maintenir une charge significative. Une BBU saine devrait être proche de 100 % lorsqu'elle est complètement chargée.
 * Date de fabrication : 08/15, 2013" : Cette batterie a presque 12 ans. La durée de vie typique des BBU de contrôleurs RAID est d'environ 2 à 5 ans, en fonction des facteurs environnementaux. Elle a largement dépassé sa durée de vie prévue.
 * État de la batterie : Degraded(Need Attention)" : Le contrôleur a explicitement reconnu que la batterie ne fonctionne pas correctement et nécessite une attention particulière.
 * "Charger Status : Inconnu" : Ce message, associé à l'état dégradé et à la faible charge, suggère que le contrôleur a des difficultés à communiquer avec la batterie ou à la charger, probablement parce que la batterie elle-même ne répond plus comme prévu en raison de son état dégradé.
 * Capacité restante : 123 mAh" contre "Capacité de charge complète : 1402 mAh" : La capacité restante ne représente qu'une infime partie de ce que la batterie est censée contenir lorsqu'elle est pleine.
 * "Nombre de cycles : 47" : Bien qu'un faible nombre de cycles puisse sembler contre-intuitif pour une batterie défaillante, il confirme en fait l'idée que la batterie s'est principalement dégradée en raison de l'âge du calendrier plutôt qu'en raison d'une utilisation intensive. Les batteries au lithium-ion, comme celles que l'on trouve dans les BBU, perdent de leur capacité au fil du temps, quel que soit le nombre de cycles de charge/décharge.
Pourquoi cela affecte-t-il les performances de votre RAID-5 ?
Les contrôleurs RAID, en particulier lorsqu'ils sont configurés pour le RAID-5, dépendent fortement d'une BBU en bon état pour permettre la mise en cache en mode "write-back". En mode "write-back", le contrôleur signale au système d'exploitation que les données ont été écrites dès qu'elles sont stockées dans le cache du contrôleur, ce qui permet d'obtenir des performances d'écriture beaucoup plus rapides. Le rôle de la BBU est de fournir une alimentation temporaire au cache en cas de coupure de courant, ce qui permet aux données du cache d'être écrites sur les disques lorsque le courant est rétabli, évitant ainsi la perte de données.
Lorsque la BBU est dégradée ou défaillante, le contrôleur RAID désactive généralement le cache write-back et passe à un mode "write-through" plus sûr mais beaucoup plus lent. En mode "write-through", le contrôleur attend que les données soient entièrement écrites sur les disques avant d'accuser réception de l'écriture au système d'exploitation. Cela augmente considérablement la latence d'écriture et réduit les performances globales d'écriture, ce qui explique la chute drastique des vitesses que vous observez (jusqu'à 15 Mo/s).
Les messages intermittents "La batterie de stockage est défaillante" et "La batterie de stockage fonctionne normalement" sont probablement des tentatives répétées du contrôleur pour vérifier l'état de la BBU. En raison de l'état dégradé de la batterie, ces vérifications échouent de manière intermittente, ce qui amène le contrôleur à signaler l'échec, puis à réussir brièvement ou à temporiser de manière à signaler l'état normal avant que l'échec suivant ne soit détecté.
Conclusion :
D'après les données de sortie de MegaCli et l'âge de la batterie, il est presque certain que votre BBU est morte ou très dégradée. La faible capacité de charge, l'état dégradé, l'état inconnu du chargeur et l'âge important sont autant d'éléments qui mènent à cette conclusion. Le faible nombre de cycles n'est pas une contradiction, mais plutôt une indication que le temps, et non l'utilisation, a été le principal facteur de sa disparition.
La BBU défaillante est directement à l'origine de vos problèmes de performances RAID-5 en forçant le contrôleur à utiliser le mode de cache d'écriture le plus lent. Le remplacement de la BBU est nécessaire pour rétablir des performances d'écriture RAID-5 optimales et garantir l'intégrité des données en cas d'incident électrique. Bien que votre R710 soit hors garantie, le remplacement de la BBU est une procédure de maintenance standard et les pièces de rechange sont généralement disponibles auprès de divers vendeurs spécialisés dans les pièces de serveur.
Ainsi, bien qu'il soit frustrant de voir un composant tomber en panne, il ne s'agit pas d'un problème "stupide" ; il s'agit d'un élément d'usure courant qui a simplement atteint la fin de sa durée de vie. Vous devriez procéder au remplacement de la BBU.

 

1 Rookie

 • 

28  messages

16 mai 2025 14:58

C'est ce que je m'attendais. mais la, j'ai eu une surprise assez... marrante (ou étrange)
j'ai reseat la BBU, pour voir. et... la Relative Charge a augmenté, et j'ai maintenant le status de charge. 

Juste en s'amusant a la reseat. j'comprends plus rien a ce serveur...

Moderator

 • 

9.4K  messages

16 mai 2025 15:07

Syxpi,

 

C’est un plaisir d’apprendre que le problème est résolu. Ce que je suggérerais également, car cela peut causer des problèmes comme ceux que vous avez eus, c’est de s’assurer que le serveur est à jour sur le BIOS, l’iDrac, ainsi que le contrôleur raid. Si ceux-ci vous soutiennent, vous augmentez les chances qu’une fausse erreur apparaisse. 

 

Faites-moi savoir si cela vous aide.

 

 

1 Rookie

 • 

28  messages

16 mai 2025 15:34

@DELL-Chris H ​ Tout est a jour. donc j'ai pas a m'inquiéter. le BIOS était déja a jour (6.6.0), l'iDRAC est a la dernière version (2.92). et la carte RAID est aussi a jour (j'ai plus la version en tête)
L'iDRAC, c'est moi même qui a fait la mise a jour, donc j'peux être sur qu'elle est faite. 

Moderator

 • 

5.1K  messages

19 mai 2025 06:20

Bonjour, je vois que le BBU de vos contrôleurs RAID est optimal. Je dis que c’est bien. Faites-nous savoir si vous avez d’autres questions.

1 Rookie

 • 

28  messages

19 mai 2025 06:29

@DELL-Young E​ La, tout fonctionne parfaitement (genre la BBU n'as aucun soucis)

peut être un reseat + un relearn forcé lui a fait du bien. 
car la. tout semble bien la? (voici un screen de ma BBU a l'heure actuel)
OMSA ne report rien, l'iDRAC est chill, le R710 ne gueule pas en disant que la BBU fail. 
c'est parfait dcp.

Aucun événement trouvé !

Top