一般来说如果服务器死机,大多数是因为显卡温度过高了,所以我们希望可以实时看到显卡温度,这样如果温度太高了也可以赶紧采取一些措施。在 Ubuntu 上其实都可以非常方便的通过 nvidia-smi
这个命令来查看显卡温度,本文简单记录一下。
文章目录
隐藏
一、查看 GPU 温度
二、实时显示显卡温度
一、查看 GPU 温度
查看方法有两种,第一种是直接使用 nvidia-smi
这个命令,输出如下,可以看到有个 83C 之类的数字,其实就是温度。
第二种方法,输入下面命令:
nvidia-smi -q -i 0,1,2,3 -d TEMPERATURE
其中 0,1,2,3 就是你想查看的哪几块显卡的温度,如果想查看所有的,也可以直接输入下面命令:
nvidia-smi -q -d TEMPERATURE
输出效果如下图所示。
以上只能是一次输出,做不到实时刷新,如果需要实时刷新,再往下看。
二、实时显示显卡温度
其实很简单,使用 watch
这个命令就可以做到。
比如:
watch -n 1 nvidia-smi
或者:
watch -n 1 nvidia-smi -q -d TEMPERATURE
其中 -n
后面的数字 1 代表每隔 1 秒刷新一次,如果想换成其他间隔也都可以,比如每 5 秒、每 10 秒等都可以。
以上就是实时显示显卡温度的方法。