Unsolved

1 Rookie

 • 

3 Posts

20

November 19th, 2025 09:33

Problém s připojením GPU NVIDIA Tesla P40 v PowerEdge R740

Dobrý den,
obracím se na Vás s prosbou o technickou pomoc.

Na serveru Dell PowerEdge R740, výrobní číslo <To protect you, your private information was removed from public view. All private data was saved to your private Case. DELL-Admin>se snažím zprovoznit grafickou kartu NVIDIA Tesla P40 (24 GB). Karta je fyzicky instalována v PCIe riseru, ale nejsem si jistý správným způsobem napájení, aby mohla karta fungovat se svým plným výkonem.

Server je vybaven redundantními zdroji o výkonu 1100 W a běží na operačním systému Ubuntu 24.04.2 LTS. Po zapojení GPU karta není viditelná v systému („nvidia-smi“ ji nehlásí), což mě vede k podezření na problém s napájením nebo kompatibilitou riseru.

Rád bych Vás požádal o:

  1. Potvrzení kompatibility Tesla P40 s PowerEdge R740 včetně doporučeného PCIe slotu / riseru.

  2. Instrukce k požadovanému napájení GPU – zda je potřeba speciální napájecí kit, kabeláž nebo jiný typ riseru (8pin/6pin konektory).

  3. Doporučení, jak korektně ověřit funkčnost této GPU v R740.

Děkuji předem za Vaši pomoc.

S pozdravem 

Moderator

 • 

9.6K Posts

November 19th, 2025 14:18

user_b8fe47,

 

Mohu potvrdit, že P40 24GB GPU je skutečně podporována na R740, ale problém, na který narážíte, je pravděpodobně absence napájecího kabelu (část # 4VPD3), který vede ze základní desky na GPU.
Co se týče požadavků na instalaci, jsou uvedeny na straně 100 zde
Nakonec bys měl být schopen potvrdit GOU přes iDrac, jakmile bude napájena a viděna. 

 

Dejte mi vědět, jestli to pomůže.

 

 

1 Rookie

 • 

3 Posts

November 20th, 2025 07:06

Dobrý den,

děkuji za brzkou odpověď. Po zakoupení a následném připojení napájecího kabelu s označením 4VPD3, který je určený k napájení grafických karet v serverech Dell PowerEdge R740 dochází k zastavení bootovacího procesu již na úrovni BIOSu. Tento stav může mít za následek nedostatečný přísun energie, což brání správné detekci a stabilnímu chodu. Server lze přesto spustit dvěma způsoby:
• Manuálním potvrzením chybové hlášky v BIOSu stisknutím klávesy F1, umožní pokračování v bootování navzdory detekovanému problému.
• Odpojením napájecího kabelu 4VPD3, po čemž systém naběhne korektně, avšak Tesla P40 zůstává napájena pouze přes PCIe riser, což se jeví jako nedostatečné.
Karta byla testována v několika různých PCIe slotech, dále byly vyzkoušeny různé distribuce BIOSu (aktuálně je nainstalována nejnovější verze 2.23.0). Byly provedeny testy s různými verzemi ovladačů a rovněž bylo otestováno zapojení pouze samotné karty. Všechny tyto kroky však vedly k identickému výsledku.

Přestože je Tesla P40 správně detekována systémem a připravena k použití, jak potvrzuje výstup příkazu $ lspci | grep -i nvidia. Karta zůstává nečinná a její výpočetní výkon není využit:

3b:00.0 VGA compatible controller: NVIDIA Corporation GP102 [GeForce GTX 1080 Ti] (rev a1)
3b:00.1 Audio device: NVIDIA Corporation GP102 HDMI Audio Controller (rev a1)
af:00.0 VGA compatible controller: NVIDIA Corporation GP102 [GeForce GTX 1080 Ti] (rev a1)
af:00.1 Audio device: NVIDIA Corporation GP102 HDMI Audio Controller (rev a1)

d8:00.0 3D controller: NVIDIA Corporation GP102GL [Tesla P40] (rev a1)

Výpis PCI, který obsahuje informace o zařízeních NVIDIA potvrzuje detekci všech tří GPU:

lspci -v | grep -i nvidia
3b:00.0 VGA compatible controller: NVIDIA Corporation GP102 [GeForce GTX 1080 Ti] (rev a1) (prog-if 00 [VGA controller])
Kernel driver in use: nvidia
Kernel modules: nvidiafb, nouveau, nvidia_drm, nvidia
3b:00.1 Audio device: NVIDIA Corporation GP102 HDMI Audio Controller (rev a1)
af:00.0 VGA compatible controller: NVIDIA Corporation GP102 [GeForce GTX 1080 Ti] (rev a1) (prog-if 00 [VGA controller])
Kernel driver in use: nvidia
Kernel modules: nvidiafb, nouveau, nvidia_drm, nvidia
af:00.1 Audio device: NVIDIA Corporation GP102 HDMI Audio Controller (rev a1)
d8:00.0 3D controller: NVIDIA Corporation GP102GL [Tesla P40] (rev a1)
Subsystem: NVIDIA Corporation GP102GL [Tesla P40]
Kernel driver in use: nvidia
Kernel modules: nvidiafb, nouveau, nvidia_drm, nvidia

Na základě výstupu NVIDIA System Management Interface nvidia-smi. Jsou zobrazeny pouze dvě GPU:

nvidia-smi +-----------------------------------------------------------------------------------------+ | NVIDIA-SMI 550.120 Driver Version: 550.120 CUDA Version: 12.4 | |-----------------------------------------+------------------------+----------------------+ | GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |=========================================+========================+======================| | 0 NVIDIA GeForce GTX 1080 Ti Off | 00000000:3B:00.0 Off | N/A | | 26% 33C P8 9W / 250W | 146MiB / 11264MiB | 0% Default | | | | N/A | +-----------------------------------------+------------------------+----------------------+ | 1 NVIDIA GeForce GTX 1080 Ti Off | 00000000:AF:00.0 Off | N/A | | 21% 32C P8 9W / 250W | 9MiB / 11264MiB | 0% Default | | | |

Moderator

 • 

3.5K Posts

November 20th, 2025 12:48

Dobrý den,

Nainstalujte kompletní sadu pro podporu GPU: Pořiďte kompletní sadu Dell R740 pro podporu GPU (např. 490-BEIX), nejen kabel. To zajišťuje, že všechny potřebné komponenty pro detekci, tepelnou správu a hlášení spotřeby energie jsou přítomny.

Zkontrolujte kabel a orientaci: Ověřte, že je kabel 4VPD3 nainstalován podle oficiálních schémat Dell, správně připojte riserovou stranu a použijte schválené porty GPU. Nekombinujte s ne-Dell nebo upravenými kabely, protože to může vést k poruchám senzorů.

Minimální POST konfigurace: Odstraňte další periferie/GPU a zkuste spustit jen s jednou GPU, pak postupně přidávat komponenty zpět. Někdy mohou DAISY-chained nebo dvojitě obsazené risery také způsobit POST chyby, pokud nejsou všechny sloty obsazeny nebo pokud je zátěž nadměrná.

Prohlédněte si iDRAC a diagnostické záznamy: iDRAC může poskytnout podrobnější informace o "selhaních inicializace napájení/GPU" nebo chybách senzorů spojených se slotem GPU nebo rozvodem napájení.

 

No Events found!

Top