Ubuntu Linux 系统实时监控 GPU 显卡温度的方法

已关闭留言

一般来说如果服务器死机,大多数是因为显卡温度过高了,所以我们希望可以实时看到显卡温度,这样如果温度太高了也可以赶紧采取一些措施。在 Ubuntu 上其实都可以非常方便的通过 nvidia-smi 这个命令来查看显卡温度,本文简单记录一下。

文章目录
隐藏
一、查看 GPU 温度
二、实时显示显卡温度

一、查看 GPU 温度

查看方法有两种,第一种是直接使用 nvidia-smi 这个命令,输出如下,可以看到有个 83C 之类的数字,其实就是温度。

第二种方法,输入下面命令:

nvidia-smi -q -i 0,1,2,3 -d TEMPERATURE

其中 0,1,2,3 就是你想查看的哪几块显卡的温度,如果想查看所有的,也可以直接输入下面命令:

nvidia-smi -q -d TEMPERATURE

输出效果如下图所示。

以上只能是一次输出,做不到实时刷新,如果需要实时刷新,再往下看。

二、实时显示显卡温度

其实很简单,使用 watch 这个命令就可以做到。

比如:

watch -n 1 nvidia-smi

或者:

watch -n 1 nvidia-smi -q -d TEMPERATURE

其中 -n 后面的数字 1 代表每隔 1 秒刷新一次,如果想换成其他间隔也都可以,比如每 5 秒、每 10 秒等都可以。

以上就是实时显示显卡温度的方法。