Unsolved

1 Rookie

 • 

6 Posts

39

January 15th, 2026 09:16

shutting down after 1hour 20seconds

sur un serveur Dell Power Edge R350 qui arret ( shutting down ) automatique après une heure 1h  et 20 secondes 

Moderator

 • 

3.5K Posts

January 15th, 2026 14:23

D'accord — pour diagnostiquer et résoudre un serveur Dell PowerEdge R350 qui s'éteint automatiquement après environ 1 heure et 20 secondes, voici une checklist structurée avec actions et commandes à réaliser. Faites-les dans l'ordre ; signalez les résultats (messages d'erreur, logs, sorties de commandes) et je vous guide ensuite.

  1. Vérifier les journaux d'alimentation et système (iDRAC / OS)
  • iDRAC : connectez-vous à l'interface iDRAC (IP) → Hardware → Logs (Lifecycle/ System Event Log). Cherchez événements liés à power, thermal, shutdown ou watchdog.
  • Sous Linux : consultez
    • sudo journalctl -b -1 --since "1 hour ago" (ou ajustez la période)
    • sudo journalctl -k
    • /var/log/messages ou /var/log/syslog selon distro
    • dmesg | less
  • Sous Windows : Event Viewer → System et Application, filtre sur Event ID liés à Power-Troubleshoot, Kernel-Power.
  1. Vérifier les paramètres d'alimentation (BIOS/iDRAC)
  • Accédez au BIOS/UEFI (F2 au démarrage) ou iDRAC / Lifecycle Controller.
  • Vérifiez : settings d'Auto Power Recovery, Power Management, AC Recovery, and Thermal/Shutdown policies.
  • Désactivez toute option qui force un arrêt programmé ou un test de watchdog si inutile.
  1. Contrôler la température et ventilation (surchauffe)
  • Dans iDRAC : Hardware → Temperatures / Fans. Vérifiez pics de température juste avant l'arrêt.
  • Sous Linux : sudo sensors (si lm-sensors installé).
  • Nettoyez filtres, vérifiez rotation des ventilateurs et présence d'alertes fan failure.
  1. Vérifier alimentation (PSU) et courant
  • iDRAC : Power Supply status (OK, Degraded, Failed). Remplacez PSU défaillante ou testez en mode single/dual PSU selon config.
  • Tester alimentation externe / PDU : fluctuations, coupures ou séquencement à ~1h20.
  • Regardez events sur PDU/UPS (s'il existe).
  1. Rechercher script/cron ou tâche planifiée qui arrête la machine
  • Linux :
    • crontab -l (pour root et autres utilisateurs)
    • sudo systemctl list-timers --all
    • grep -R "shutdown|poweroff|halt" /etc /var
  • Windows : Task Scheduler (Tâches planifiées) — recherchez tâches avec action "shutdown" ou scripts.
  1. Vérifier watchdogs / processus de monitoring
  • Des outils (monitoring externe, scripts de supervision, agents de gestion) peuvent forcer reboot/shutdown après timeout. Inspectez agents comme Dell OMSA, OpenManage, ou outils tiers.
  • Désactivez temporairement ces agents pour tester.
  1. Vérifier firmware/iDRAC/BIOS à jour
  • Notez versions de BIOS et iDRAC : dans iDRAC ou racadm getversion.
  • Si firmware ancien, programmez mise à jour (attention sauvegarde & fenêtre maintenance).
  1. Exécuter test de matériel / diagnostics Dell
  • Depuis iDRAC ou Lifecycle Controller, lancez Diagnostics / Hardware Diagnostics.
  • Exécutez test mémoire, CPU, PSU, storage.
  1. Mode sécurisé / Live USB pour isoler OS vs matériel
  • Démarrez serveur depuis live Linux (USB) et observez si arrêt se reproduit. Si oui, problème matériel/firmware ; sinon, problème logiciel OS.
  1. Collecte d'informations à fournir ici (copiez-collez)
  • Modèle exact et configuration du R350 (PSU count, RAM, RAID controller).
  • Versions BIOS et iDRAC.
  • Extraits des logs iDRAC SEL autour du shutdown (timestamps).
  • Sorties de:
    • sudo journalctl -b -1 --no-pager | tail -n 50
    • sudo dmidecode -t system | grep -i version
    • racadm getsel (si racadm dispo)
  • Indiquez si serveur est sur PDU/UPS, et s'il y a événements corrélés.

Si voulez, je vous guide pas-à-pas pour récupérer les logs iDRAC ou les commandes Linux/Windows à exécuter. Que préférez-vous ?

1 Rookie

 • 

6 Posts

January 15th, 2026 15:30

@Dell-Martin S merci  pour votre réponse

les services sont bloque meme eventvwier non executable  aussi les commande .msc 

 

Moderator

 • 

9.6K Posts

January 15th, 2026 15:40

Ma première pensée est que vous avez une version d’évaluation du système d’exploitation, qui, je crois, après un certain temps, commencera à s’éteindre après une heure si le système n’a pas été activé. Si ce n’est pas le cas, ma prochaine question serait de savoir si vous avez des droits d’administrateur sur le serveur ; sinon, vous devrez peut-être faire appel à quelqu’un qui en a, car cela expliquerait pourquoi vous ne pouvez pas accéder à certains outils. 
Enfin, lors du démarrage du serveur, voyez-vous des voyants ambrés ou des erreurs affichés sur l’écran LCD ?

 

 

 

1 Rookie

 • 

6 Posts

January 15th, 2026 15:46

@DELL-Chris H pour le probleme de shutting down est resolus lier au licence windows 

le duxieme non   , oui jai une session admin et operateru avec les meme autorisation 

le fait que je veux execute la commande lusrmgr.msc  mais rien ne s'affiche 

aussi pour les autre (compmgmt.msc ,

merci

No Events found!

Top