8gpu
8GPU: A6000 の nvidia-smi と deviceQuery
HPCDIY-ERMGPU8R4S(こちら)に A6000 を 8 枚実装して、nvidia-smi と deviceQuery を実行してみました。
A6000 1, 2, 4, 8 GPUでの網羅的な tf_cnn_benchmarks 計測
A6000を1, 2, 4, 8 GPU 使い、batch size を64, 128, 256, 512, 1024 と変化させてtf_cnn_benchmarks での学習速度を計測しました。
modelは、resnet50, inception3, vgg16, nasnet, resnet152, inception4です。
fp16とfp32の学習速度を計測しました。
RTX3090 1, 2, 4, 8 GPUでの網羅的な tf_cnn_benchmarks 計測
GeForce RTX 3090を1, 2, 4, 8 GPU 使い、batch size を64, 128, 256, 512と変化させてtf_cnn_benchmarks での学習速度を計測しました。
modelは、resnet50, inception3, vgg16, nasnet, resnet152, inception4です。
fp16とfp32の学習速度を計測しました。
A6000 x8 と RTX3090 x8 を tf_cnn_benchmarks で学習速度を比較する
GeForceでは最強のRTX 3090と、NVIDIA RTX A6000とは価格差はかなりありますが(2021年7月12日現在、¥329,220 vs ¥589,850,
お値引前の消費税抜き当サイト価格)、性能差はどの程度なのか、8GPU並列までの性能を、tf_cnn_benchmarksを使って比較してみました。
8GPU: HPCDIY-ERMGPU8R4S に RTX3090を8枚実装してGPU100%での消費電力と温度
HPCDIY-ERMGPU8R4S(こちら)にGeForce RTX 3090 を8枚実装し、gpu_burn(こちら)を実行して、消費電力と温度が定常状態になるまでを nvidia-smi -l で監視してみました。
8GPU: GeForce RTX 3090 の nvidia-smi と deviceQuery
HPCDIY-ERMGPU8R4S(こちら)に GeForce RTX 3090 を 8 枚実装して、nvidia-smi と deviceQuery を実行してみました。