nvidia-smi常用命令

支持的可选项

MEMORY, UTILIZATION, ECC, TEMPERATURE, POWER, CLOCK,
COMPUTE, PIDS, PERFORMANCE, SUPPORTED_CLOCKS,
PAGE_RETIREMENT, ACCOUNTING, ENCODER_STATS,
SUPPORTED_GPU_TARGET_TEMP, VOLTAGE
FBC_STATS, ROW_REMAPPER 

查询某项的值
nvidia-smi -q -d <xxx>
示例:
#查询MEM,SM 最大频率 
nvidia-smi -q -d CLOCK 

设置MEM, SM 频率(用于性能测试)


# 查询当前卡的频率
nvidia-smi -q -d CLOCK 

# 锁定频率
nvidia-smi -ac 5001,1590

# 重置到 auto
nvidia-smi -rac

Windows上多个CUDA切换

# window 平台切换 cuda 版本 (powershell)
$env:CUDA_PATH="C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v<xxx>"

查询GPU各资源的利用率

# 间隔1s 输出0号卡各状态
nvidia-smi dmon -i 0 -d 1

输出示例:
# gpu   pwr gtemp mtemp    sm   mem   enc   dec  mclk  pclk
# Idx     W     C     C     %     %     %     %   MHz   MHz
    0    15    88     -     0     7     0     0   405   139
    0    11    88     -     0     6     0     0   405   151