November , 2020
4GPU: 再計測 GeForce RTX 3090 Deep Learning Benchmarks
再計測(NGCのtensorflow:20.10-tf1-py3使用)GeForce RTX 3090 の Deep Learning 学習での性能評価のため、HPCDIY-ERM1GPU4TS に4枚実装して、tensorflow で tf_cnn_benchmarks.py(ダウンロートはこちら)を実行してみました。
前回(こちら)より良い成績になりました。
CPU: AMD EPYC Rome 7252 DP/UP 8C/16T 3.1G 64M 120W, Memory: 128GB, SSD: NVMe M.2 512GB
NVIDIA Driver: 455.32.00
TensorFlow: nvcr.io/nvidia/tensorflow:20.10-tf1-py3
2GPU: NVIDIA A100 Deep Learning Benchmarks
NVIDIA A100 PCIe 40GB の Deep Learning 学習での性能評価のため、HPCDIY-ERMGPU8R4S に2枚実装して、tensorflow で tf_cnn_benchmarks.py(ダウンロートはこちら)を実行してみました。
CPU: 2x AMD EPYC Rome 7302 DP/UP 16C/32T 3.0G 128M 155W, Memory: 512GB, SSD: NVMe U.2 1.92TB
NVIDIA Driver: 455.32.00
TensorFlow: nvcr.io/nvidia/tensorflow:20.10-tf1-py3
2GPU: HPCDIY-ERMGPU8R4S に NVIDIA A100 を2枚実装してGPU100%での消費電力と温度
HPCDIY-ERMGPU8R4S(こちら)にGeForce NVIDIA A100 PCIe 40GB を枚実装し、gpu_burn(こちら)を実行して、消費電力と温度が定常状態になるまでを nvidia-smi -l で監視してみました。
2GPU: NVIDIA A100 の nvidia-smi と deviceQuery
HPCDIY-ERMGPU8R4S(こちら)に NVIDIA A100 を 2 枚実装して、nvidia-smi と deviceQuery を実行してみました。