轩辕镜像
轩辕镜像专业版
个人中心搜索镜像
交易
充值流量我的订单
工具
工单支持镜像收录Run 助手IP 归属地密码生成Npm 源Pip 源
帮助
常见问题我要吐槽
其他
关于我们网站地图

官方QQ群: 13763429

轩辕镜像
镜像详情
rocm/device-metrics-exporter
官方博客使用教程热门镜像工单支持
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。
所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。
轩辕镜像 - 国内开发者首选的专业 Docker 镜像下载加速服务平台 - 官方QQ群:13763429 👈点击免费获得技术支持。
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。

本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com

device-metrics-exporter Docker 镜像下载 - 轩辕镜像

device-metrics-exporter 镜像详细信息和使用指南

device-metrics-exporter 镜像标签列表和版本信息

device-metrics-exporter 镜像拉取命令和加速下载

device-metrics-exporter 镜像使用说明和配置指南

Docker 镜像加速服务 - 轩辕镜像平台

国内开发者首选的 Docker 镜像加速平台

极速拉取 Docker 镜像服务

相关 Docker 镜像推荐

热门 Docker 镜像下载

device-metrics-exporter
rocm/device-metrics-exporter

device-metrics-exporter 镜像详细信息

device-metrics-exporter 镜像标签列表

device-metrics-exporter 镜像使用说明

device-metrics-exporter 镜像拉取命令

Docker 镜像加速服务

轩辕镜像平台优势

镜像下载指南

相关 Docker 镜像推荐

AMD设备指标导出器,用于向Prometheus提供监控指标
2 收藏0 次下载activerocm镜像
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源
中文简介版本下载
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源

device-metrics-exporter 镜像详细说明

device-metrics-exporter 使用指南

device-metrics-exporter 配置说明

device-metrics-exporter 官方文档

AMD Device Metrics Exporter for Prometheus 镜像文档

镜像概述和主要用途

本镜像是一个针对Prometheus的AMD设备指标导出器,用于收集AMD硬件设备(如Radeon GPU、EPYC CPU等)的关键运行指标,并通过HTTP端点以Prometheus兼容格式暴露,支持Prometheus服务器进行指标抓取与监控分析。

核心功能和特性

核心功能

  • 多设备支持:兼容AMD Radeon系列GPU、EPYC系列CPU及部分APU设备
  • 全面指标采集:覆盖设备温度、利用率(GPU/CPU核心、内存)、功耗、时钟频率、内存使用量等关键指标
  • Prometheus原生兼容:指标格式符合Prometheus规范,支持直接接入Prometheus监控体系
  • 轻量部署:基于Alpine或Distroless基础镜像,镜像体积小,资源占用低

主要特性

  • HTTP指标端点:默认通过/metrics路径暴露指标,支持自定义监听端口
  • 设备筛选:支持通过设备ID、型号或类型筛选需监控的设备
  • 实时采集:指标采集间隔可配置,默认10秒/次
  • 日志分级:支持info/debug/warn/error多级日志,便于问题排查

使用场景和适用范围

典型使用场景

  • 数据中心AMD GPU/CPU集群状态监控
  • 高性能计算(HPC)环境中AMD设备资源利用率追踪
  • 边缘计算节点AMD硬件健康状态监控
  • 个人工作站/服务器AMD设备性能调优与故障预警

适用范围

  • 运行AMD Radeon GPU(需ROCm驱动或开源AMDGPU驱动)的Linux主机
  • 搭载AMD EPYC/Ryzen CPU的服务器/工作站
  • 支持Docker容器化部署的环境(物理机、虚拟机、Kubernetes集群等)

使用方法和配置说明

前置要求

  • 主机已安装AMD设备驱动(如ROCm 5.0+或开源AMDGPU驱动)
  • 容器需具备访问主机设备信息的权限(通过挂载主机系统目录实现)

基本使用(Docker Run)

最简启动命令

docker run -d \
  --name amd-metrics-exporter \
  -p 9255:9255 \
  -v /sys:/sys:ro \
  --device /dev/dri \
  amddevice/metrics-exporter:latest

自定义配置示例

docker run -d \
  --name amd-metrics-exporter \
  -p 9255:9255 \
  -e LISTEN_PORT=9255 \
  -e DEVICE_FILTER="GPU-1234;CPU-5678" \
  -e SCRAPE_INTERVAL=5 \
  -e LOG_LEVEL=debug \
  -v /sys:/sys:ro \
  -v /dev/dri:/dev/dri \
  amddevice/metrics-exporter:latest

Docker Compose配置

version: '3.8'
services:
  amd-metrics-exporter:
    image: amddevice/metrics-exporter:latest
    container_name: amd-metrics-exporter
    ports:
      - "9255:9255"
    environment:
      - LISTEN_PORT=9255           # 监听端口(默认9255)
      - DEVICE_FILTER="GPU"         # 设备筛选(支持型号/ID模糊匹配,多设备用;分隔)
      - SCRAPE_INTERVAL=10          # 指标采集间隔(秒,默认10)
      - LOG_LEVEL=info              # 日志级别(info/debug/warn/error,默认info)
    volumes:
      - /sys:/sys:ro                # 只读挂载系统设备信息目录
    devices:
      - /dev/dri:/dev/dri           # 挂载GPU显示设备(若监控GPU)
    restart: unless-stopped

配置参数说明

环境变量配置

环境变量名描述默认值示例值
LISTEN_PORTHTTP服务监听端口92559100
DEVICE_FILTER设备筛选规则(支持型号/ID模糊匹配,多设备用;分隔,空值表示全部设备)空值"GPU-1234;EPYC"
SCRAPE_INTERVAL指标采集间隔(秒)105
LOG_LEVEL日志输出级别infodebug
METRICS_PATH指标暴露HTTP路径/metrics/amd_metrics

指标暴露与Prometheus集成

指标端点

exporter启动后,通过http://<容器IP>:<LISTEN_PORT>/<METRICS_PATH>暴露指标,例如:

http://localhost:9255/metrics

Prometheus抓取配置示例

在Prometheus的prometheus.yml中添加如下配置:

scrape_configs:
  - job_name: 'amd_device_metrics'
    static_configs:
      - targets: ['amd-metrics-exporter:9255']  # 替换为exporter容器地址:端口
    scrape_interval: 15s  # 建议与exporter采集间隔一致或更长

常见问题与注意事项

  1. 设备访问权限:

    • 若监控GPU,需确保容器挂载/dev/dri设备(--device /dev/dri)
    • 部分系统信息需访问/sys目录,需通过-v /sys:/sys:ro挂载主机/sys目录(只读)
  2. 驱动兼容性:

    • 推荐使用ROCm 5.2+或Linux内核自带的AMDGPU驱动(内核版本5.4+)
    • 驱动未安装或版本过低可能导致指标采集不全或失败
  3. 多设备筛选:

    • 使用DEVICE_FILTER环境变量筛选设备,支持模糊匹配(如DEVICE_FILTER="Radeon"仅监控Radeon系列GPU)
    • 多设备用;分隔(如DEVICE_FILTER="card0;card1"监控指定GPU设备)
  4. 容器资源限制:

    • 建议为容器分配至少1CPU核心和64MB内存(指标采集资源消耗低)

指标参考(部分关键指标)

指标名称描述标签
amd_gpu_temperature_celsiusGPU核心温度(摄氏度)device_id, model, card
amd_gpu_utilization_percentGPU利用率(百分比)device_id, model, card
amd_gpu_memory_used_bytesGPU内存已使用量(字节)device_id, model, card
amd_cpu_core_utilizationCPU核心利用率(百分比)cpu_id, model, socket
amd_device_power_watts设备实时功耗(瓦特)device_id, model, type
查看更多 device-metrics-exporter 相关镜像 →
victoriametrics/victoria-metrics logo
victoriametrics/victoria-metrics
by Victoria Metrics
认证
The single-node VictoriaMetrics: a fast, cost-effective, scalable TSDB in one easy-to-deploy binary.
5750M+ pulls
上次更新:2 天前
docker/ucp-metrics logo
docker/ucp-metrics
by Docker, Inc.
认证
暂无描述
110M+ pulls
上次更新:5 年前
rancher/metrics-server logo
rancher/metrics-server
by Rancher by SUSE
认证
暂无描述
7100M+ pulls
上次更新:3 年前

常见问题

轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

轩辕镜像免费版与专业版有分别支持哪些镜像?

免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。

流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

轩辕镜像下载加速使用手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

🔐

登录方式进行 Docker 镜像下载加速教程

通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤

🐧

Linux Docker 镜像下载加速教程

在 Linux 系统上配置轩辕镜像源,支持主流发行版

🖥️

Windows/Mac Docker 镜像下载加速教程

在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统

📦

Docker Compose 镜像下载加速教程

在 Docker Compose 中使用轩辕镜像加速,支持容器编排

📋

K8s containerd 镜像下载加速教程

在 k8s 中配置 containerd 使用轩辕镜像加速

🔧

宝塔面板 Docker 镜像下载加速教程

在宝塔面板中配置轩辕镜像加速,提升服务器管理效率

💾

群晖 NAS Docker 镜像下载加速教程

在 Synology 群晖NAS系统中配置轩辕镜像加速

🐂

飞牛fnOS Docker 镜像下载加速教程

在飞牛fnOS系统中配置轩辕镜像加速

📱

极空间 NAS Docker 镜像下载加速教程

在极空间NAS中配置轩辕镜像加速

⚡

爱快路由 ikuai Docker 镜像下载加速教程

在爱快ikuai系统中配置轩辕镜像加速

🔗

绿联 NAS Docker 镜像下载加速教程

在绿联NAS系统中配置轩辕镜像加速

🌐

威联通 NAS Docker 镜像下载加速教程

在威联通NAS系统中配置轩辕镜像加速

📦

Podman Docker 镜像下载加速教程

在 Podman 中配置轩辕镜像加速,支持多系统

📚

ghcr、Quay、nvcr、k8s、gcr 等仓库下载镜像加速教程

配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤

🚀

专属域名方式进行 Docker 镜像下载加速教程

无需登录即可使用轩辕镜像加速服务,更加便捷高效

需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429

商务:17300950906
|©2024-2025 源码跳动
商务合作电话:17300950906|Copyright © 2024-2025 杭州源码跳动科技有限公司. All rights reserved.