腾讯云GPU 使用率显示 100% – 腾讯云教程

2022年 10月 24日 发表评论
腾讯云正在大促:点击直达 阿里云超级红包:点击领取
免费/便宜/高性价比服务器汇总入口(已更新):点击这里了解
使用 GPU 计算型实例的过程中,在系统内部使用 nvidia-smi 查看 GPU 状态时,可能遇到没有运行任何使用 GPU 的应用,但 GPU 使用率显示100%的情况。如下图所示: 实例加载 NVIDIA 驱动时,ECC Memory

<h2 现象描述

使用 GPU 计算型实例的过程中,在系统内部使用 nvidia-smi 查看 GPU 状态时,可能遇到没有运行任何使用 GPU 的应用,但 GPU 使用率显示100%的情况。如下图所示:
腾讯云GPU 使用率显示 100% – 腾讯云教程

<h2 可能原因

实例加载 NVIDIA 驱动时,ECC Memory Scrubbing 机制造成。

<h2 解决思路

在实例系统内执行 nvidia-smi -pm 1 命令,让 GPU Driver 进入 Persistence 模式。

<h2 处理步骤

  1. 登录 GPU 计算型实例,执行以下命令:
    nvidia-smi -pm 1

    腾讯云GPU 使用率显示 100% – 腾讯云教程

  2. 执行以下命令,检查 GPU 使用率:
    nvidia-smi

    GPU 使用率正常,如下图所示:
    腾讯云GPU 使用率显示 100% – 腾讯云教程

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: