轩辕镜像 官方专业版
轩辕镜像
专业版
轩辕镜像 官方专业版
轩辕镜像
专业版
首页个人中心搜索镜像
交易
充值流量¥7起我的订单
文档
工具
提交工单页面收录
ufm-plugin-tfs

mellanox/ufm-plugin-tfs

mellanox

UFM Telemetry stream to Fluentd (TFS)插件用于从配置的UFM Telemetry HTTP端点提取计数器数据,并将其实时流式传输到Fluentd收集器,支持多端点配置、数据分片、自定义元字段及性能监控。

1 次收藏下载次数: 0状态:社区镜像维护者:mellanox仓库类型:镜像最近更新:10 个月前
让 AI 帮你使用轩辕镜像? · 展开查看说明 · 点击收起说明

如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。

只需在 AI 对话中先发送下面这句话即可:

请先完整阅读并严格遵守以下文档中的全部规则与要求:

https://xuanyuan.cloud/agents.md

在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。

查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。

中文简介
下载命令
镜像标签列表与下载命令
使用轩辕镜像,把时间还给真正重要的事。
点击查看

UFM Telemetry stream to Fluentd (TFS) 插件

概述

TFS UFM插件旨在从配置的UFM Telemetry HTTP端点提取计数器数据,并将其实时流式传输到配置的Fluentd收集器。NVIDIA UFM Telemetry平台提供网络性能和状态监控工具,捕获并流式传输丰富的实时网络遥测信息及应用工作负载使用情况至本地或云数据库以进行进一步分析。作为网络管理器,UFM Telemetry持有网络拓扑的实时遥测信息,TFS插件通过流式传输这些数据至Fluentd,确保信息随时间变化能及时反映到遥测控制台。

!https://raw.githubusercontent.com/Mellanox/ufm_sdk_3.0/main/plugins/fluentd_telemetry_plugin/TFS_Architecture.png

发布说明

最新版本 (1.1.0-0)

  1. 移除对Prometheus格式遥测数据获取的支持。
  2. 新增telemetry_request_timeout选项,默认值为60秒。

1.0.15-1

  1. 增加对XDR技术的支持。
  2. 新增enable_cached_stream_on_telemetry_fail选项(默认:true):当遥测端点不可用时,允许流式传输上次成功迭代的缓存数据,以提升遥测端点故障期间的用户体验。
  3. 修复多个bug。

1.0.0-14

  1. 将默认Fluent流式传输协议从HTTP更改为FORWARD。
  2. 集成c-forward流传输库。
  3. 提升CSV处理性能。
  4. 修复多个bug。

部署

在UFM-SDN Appliance上部署插件

  • 以admin身份登录
  • 运行以下命令:
    bash
    enable
    
    bash
    config terminal
    
  • 确保UFM正在运行:
    bash
    show ufm status
    
    • 若UFM未运行,启动UFM:
      bash
      ufm start
      
  • 确保Docker正在运行:
    bash
    no docker shutdown
    
  • 加载最新插件Docker镜像
    • 若为HA环境,需在备用节点也加载插件。
    • 若设备已联网,直接运行:
      bash
      docker pull docker.xuanyuan.run/mellanox/ufm-plugin-tfs
      
    • 若设备未联网,需离线加载镜像:
      • 在联网机器上保存Docker镜像:
        bash
        docker save mellanox/ufm-plugin-tfs:latest | gzip > ufm-plugin-tfs.tar.gz
        
      • 将文件移至设备可访问的SCP共享位置。
      • 获取镜像到设备:
        bash
        image fetch scp://user@hostname/path-to-file/ufm-plugin-tfs.tar.gz
        
      • 加载镜像:
        bash
        docker load ufm-plugin-tfs.tar.gz
        
  • 启用并启动插件:
    bash
    ufm plugin tfs add
    
  • 检查插件状态:
    bash
    show ufm plugin
    

在UFM Enterprise(裸金属/Docker)上部署插件

  • 加载最新插件容器
    • 若为HA环境,需在备用节点也加载插件。
    • 若机器已联网,直接运行:
      bash
      docker pull docker.xuanyuan.run/mellanox/ufm-plugin-tfs
      
    • 若UFM机器未联网,需离线加载镜像:
      • 在联网机器上保存Docker镜像:
        bash
        docker save mellanox/ufm-plugin-tfs:latest | gzip > ufm-plugin-tfs.tar.gz
        
      • 将文件移至UFM机器可访问的共享位置。
      • 加载镜像到UFM机器:
        bash
        docker load -i </[some-shared-location]/ufm-plugin-tfs.tar.gz
        
  • 启用并启动插件
    • UFM裸金属安装:
      bash
      /opt/ufm/scripts/manage_ufm_plugins.sh add -p tfs
      
    • UFM Docker安装:
      bash
      docker exec ufm /opt/ufm/scripts/manage_ufm_plugins.sh add -p tfs
      
  • 检查插件状态
    • UFM裸金属安装:
      bash
      /opt/ufm/scripts/manage_ufm_plugins.sh show
      
    • UFM Docker安装:
      bash
      docker exec ufm /opt/ufm/scripts/manage_ufm_plugins.sh show
      

Fluentd部署配置

  • 拉取Fluentd Docker镜像:
    bash
    docker pull docker.xuanyuan.run/fluent/fluentd
    
  • 运行Fluentd容器:
    bash
    docker run -ti --rm --network host -v /tmp/fluentd:/fluentd/etc docker.xuanyuan.run/fluentd -c /fluentd/etc/fluentd.conf -v
    
  • 提供https://github.com/Mellanox/ufm_sdk_3.0/blob/main/plugins/fluentd_telemetry_plugin/conf/fluentd.conf%E4%BD%9C%E4%B8%BA%E9%85%8D%E7%BD%AE%E7%A4%BA%E4%BE%8B%E3%80%82
  • TFS支持通过FORWARD和HTTP协议向Fluent目标发送数据,FORWARD为默认协议;若需切换至HTTP协议,需启用https://github.com/Mellanox/ufm_sdk_3.0/blob/main/plugins/fluentd_telemetry_plugin/conf/fluentd_telemetry_plugin.cfg#L16%E3%80%82

IPv6配置

TFS支持通过IPv6向Fluent目标流式传输数据,需确保Fluent监听IPv6接口,将https://github.com/Mellanox/ufm_sdk_3.0/blob/main/plugins/fluentd_telemetry_plugin/conf/fluentd.conf#L4%EF%BC%88***d 0.0.0.0)替换为(***d ::)。

日志文件位置:主机上日志文件位于/opt/ufm/files/log/plugins/tfs/tfs.log;对于低于6.17.0版本的UFM,日志文件位于/opt/ufm/files/log/tfs.log。

使用方法

TFS配置参数详情

参数是否必填描述
fluentd-endpoint.host是Fluentd端点的主机名、IPv4或IPv6
fluentd-endpoint.port是Fluentd端点端口(应与https://github.com/Mellanox/ufm_sdk_3.0/blob/main/plugins/fluentd_telemetry_plugin/conf/fluentd.conf#L4%E4%B8%AD%E9%85%8D%E7%BD%AE%E7%9A%84%E7%AB%AF%E5%8F%A3%E4%B8%80%E8%87%B4%EF%BC%89
fluentd-endpoint.timeout是Fluentd端点流传输超时时间(默认120秒)
ufm-telemetry-endpoint.host是UFM Telemetry端点的主机名、IPv4或IPv6(默认127.0.0.1)
ufm-telemetry-endpoint.port是UFM Telemetry端点端口(默认9001)
ufm-telemetry-endpoint.url是UFM Telemetry端点URL(默认'csv/metrics',Prometheus格式可使用'metrics')
ufm-telemetry-endpoint.interval是流传输间隔(默认10秒)
ufm-telemetry-endpoin***ssage_tag_name否Fluentd端点消息的标签名(默认ufm-telemetry-endpoint.host:ufm-telemetry-endpoint.port)
streaming.bulk_streaming是若为True,所有遥测记录将在一条消息中流式传输;否则每条记录单独传输(默认True)
streaming.compressed_streaming是若为True,流数据将以gzip压缩的JSON发送(需确保Fluentd接收器配置正确,见Fluentd部署配置部分);否则以纯文本JSON发送(默认True)
streaming.stream_only_new_samples是若为True,插件仅流式传输变化的值(默认True)
streaming.enabled是若为True,在所需配置设置后启动流传输(默认False)
logs-config.logs_file_name是日志文件名(默认'/log/tfs.log')
logs-config.logs_level是日志级别(默认'INFO')
logs-config.max_log_file_size是日志文件最大大小(字节,默认10 MB)
logs-config.log_file_backup_count是备份日志文件最大数量(默认5)

设置/更新插件配置

提供以下REST API用于设置插件配置:

方法:POST
URL:https://[HOST-IP]/ufmRest/plugin/tfs/conf

cURL示例:

curl
curl --location 'https://<UFM_IP>/ufmRest/plugin/tfs/conf' \
--header 'Content-Type: application/json' \
--data '{
    "fluentd-endpoint": {
        "host": "<FLUENT_RECIEVER_IP>",
        "port": 24224,
        "timeout": 120
    },
    "streaming": {
        "enabled": true,
        "stream_only_new_samples": false
    },
    "ufm-telemetry-endpoint": [
        {
            "host": "127.0.0.1",
            "interval": <COLLECTING_INTERVAL_SECONDS, e.g. 30>,
            "port": <TELEMETRY_HTTP_PORT, e.g. 9001>,
            "url": <TELEMETRY_CSET_URL, e.g. csv/metrics OR csv/cset/converted_enterprise>
        }
    ]
}' -k -u <UFM_USERNAME>:<UFM_PASSWORD>

完整Payload示例:

json
{
    "ufm-telemetry-endpoint": [{
        "host": "127.0.0.1",
        "url": "csv/metrics",
        "port": 9001,
        "interval": 30,
        "message_tag_name": "high_freq_endpoint"
    }],
    "fluentd-endpoint": {
        "host": "10.209.36.68",
        "port": 24226
    },
    "streaming": {
        "compressed_streaming": false,
        "bulk_streaming": true,
        "enabled": true,
        "stream_only_new_samples": true
    },
    "logs-config": {
        "log_file_backup_count": 5,
        "log_file_max_size": 10485760,
        "logs_file_name": "/log/tfs.log",
        "logs_level": "INFO"
    },
    "meta-fields":{
        "alias_node_description": "node_name",
        "alias_node_guid": "AID",
        "add_type":"csv"
    }
}

获取插件配置

提供以下REST API用于获取当前插件配置:

方法:GET
URL:https://[HOST-IP]/ufmRest/plugin/tfs/conf

cURL示例:

curl
curl --location 'https://<UFM_IP>/ufmRest/plugin/tfs/conf' -k -u <UFM_USERNAME>:<UFM_PASSWORD>

响应示例:

json
{
    "ufm-telemetry-endpoint": [{
        "host": "127.0.0.1",
        "url": "csv/metrics",
        "port": 9001,
        "interval": 30,
        "message_tag_name": "high_freq_endpoint"
    }],
    "fluentd-endpoint": {
        "host": "10.209.36.68",
        "port": 24226
    },
    "streaming": {
        "compressed_streaming": false,
        "bulk_streaming": true,
        "enabled": true,
        "stream_only_new_samples": true
    },
    "logs-config": {
        "log_file_backup_count": 5,
        "log_file_max_size": 10485760,
        "logs_file_name": "/log/tfs.log",
        "logs_level": "INFO"
    },
    "meta-fields":{
        "alias_node_description": "node_name",
        "alias_node_guid": "AID",
        "add_type":"csv"
    }
}

从多个UFM Telemetry端点流式传输数据

可配置TFS插件从多个端点轮询指标,每个端点有独立的轮询/流传输间隔。通过conf API添加遥测端点配置即可。

多UFM Telemetry端点Payload示例:

json
{
    "ufm-telemetry-endpoint": [{
        "host": "127.0.0.1",
        "url": "csv/metrics",
        "port": 9001,
        "interval": 10,
        "message_tag_name": "high_freq_endpoint"
    },{
        "host": "127.0.0.1",
        "url": "csv/metrics",
        "port": 9002,
        "interval": 60,
        "message_tag_name": "low_freq_endpoint"
    }],
    "fluentd-endpoint": {
        "host": "10.209.36.68",
        "port": 24226
    }
}

UFM Telemetry中的分片功能

UFM Telemetry内置的分片功能支持从多个遥测指标端点高效轮询数据,适用于数据量大或带宽有限的网络环境。

如何在TFS中使用分片

需在配置的遥测端点URL中添加特定参数:num_shards(分片总数)、shard(当前分片索引)、sharding_field(分片字段)。

分片配置Payload示例:

json
{
    "ufm-telemetry-endpoint": [{
        "host": "127.0.0.1",
        "url": "csv/xcset/ib_basic_debug?num_shards=3&shard=0&sharding_field=port_guid",
        "port": 9002,
        "interval": 120
    },{
        "host": "127.0.0.1",
        "url": "csv/xcset/ib_basic_debug?num_shards=3&shard=1&sharding_field=port_guid",
        "port": 9002,
        "interval": 120
    },{
        "host": "127.0.0.1",
        "url": "csv/xcset/ib_basic_debug?num_shards=3&shard=2&sharding_field=port_guid",
        "port": 9002,
        "interval": 120
    }],
    "fluentd-endpoint": {
        "host": "10.209.36.68",
        "port": 24226
    }
}

分片调优

为获得最佳性能,建议调整分片使单个分片传输时间约为10-15秒,以避免遥测服务器超时。可根据网络状况调整分片数量(如网络较慢时增加分片数)。

向TFS消息添加自定义元字段记录

元字段是可添加到TFS流传输记录中的自定义字段,分为别名(Aliases)和常量(Constants)。

别名(Aliases)

重命名记录中已有的字段,仅匹配精确字段名。
语法:alias_originalFieldName=aliasName
示例:将"node_guid"重命名为"AID":alias_node_guid=AID

常量(Constants)

添加具有固定值的新字段。
语法:add_newFieldName=constantValue
示例:添加"type"字段,值为"csv":add_type=csv

配置示例

json
{
    "meta-fields": {
        "alias_node_description": "node_name",
        "alias_node_guid": "AID",
        "add_type": "csv"
    }
}

预期输出

json
{
    "timestamp": "1644411135311315",
    "source_id": "0xe41d2d030003e450",
    "node_guid": "e41d2d030003e450",
    "port_guid": "e41d2d030003e450",
    "port_num": "10",
    "node_description": "SwitchIB Mellanox Technologies",
    "node_name": "SwitchIB Mellanox Technologies",
    "AID": "e41d2d030003e450",
    "type": "csv"
}

镜像拉取方式

您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。

轩辕镜像加速拉取命令点我查看更多 ufm-plugin-tfs 镜像标签

docker pull docker.xuanyuan.run/mellanox/ufm-plugin-tfs:<标签>

使用方法:

  • 登录认证方式
  • 免认证方式

DockerHub 原生拉取命令

docker pull mellanox/ufm-plugin-tfs:<标签>

轩辕镜像配置手册

按平台快速找到配置文档

一键安装

一键安装 Docker

Linux Docker 一键安装

AI

用 AI 使用轩辕镜像

agents.md · AI 对话 · 提示词

Docker

登录仓库拉取

登录认证 · 私有仓库

专属域名拉取

免登录 · 高速拉取

Linux

Docker 镜像配置

Windows / Mac

Docker Desktop 配置

MacOS OrbStack

OrbStack 容器

Apple Container

macOS 原生容器

Docker Compose

Compose 项目配置

NAS

群晖

Synology 配置

飞牛

fnOS 镜像配置

绿联

绿联 NAS

威联通

QNAP 配置

极空间

极空间 NAS

Unraid

Unraid NAS

企业仓库

其他仓库

ghcr · Quay · nvcr

Harbor 镜像源

Proxy Repository 对接

Portainer 镜像源

Registries 配置

Nexus 镜像源

Docker Proxy 缓存

开发工具

Dev Containers

VS Code 开发容器

Podman

Podman 配置指南

Singularity / Apptainer

HPC 科学计算容器

Kubernetes

K8s Containerd

Kubernetes · Containerd

K3s

轻量级集群

面板 / 网络

爱快路由

iKuai 镜像加速

宝塔面板

一键配置镜像源

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

功能

版本功能对比

功能对比 · 版本选择

支持的镜像仓库

Docker Hub · GCR · GHCR

新手拉取配置

登录 · 专属域名 · 配置

docker search 限制

专属域名 · Hub 搜索

不支持 push

仅支持 pull · 不支持

拉取速度原因

带宽 · 缓存 · 冷热镜像

错误码

402 与流量用尽

402 · 流量包 · 充值

401 认证失败

401 · docker login

manifest unknown

标签错误 · 镜像不存在

410 Gone 排查

410 · Docker 升级

429 限流

免费版 · 专业版 · 企业版 · 请求频率

其他报错

DNS 超时

DNS 解析 · 网络超时

TLS 证书失败

no matching manifest(架构)

账号

失败是否计费

manifest · blob · 计费

申请开发票(企业 / 个人)

企业 · 个人 · 工单

修改登录密码

网站 · 仓库 · 重置

注销账户

工单 · 数据 · 注销

原理

mirrors 不生效

daemon.json · 重启

去掉域名前缀

docker tag · 重命名

指定架构拉取

ARM64 · AMD64 · 多架构

latest 与「最新」

digest · 版本号 · 标签

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
mellanox/ufm-plugin-tfs
教程轩辕镜像功能与使用教程
定价查看流量套餐与价格
热门查看热门 Docker 镜像推荐
博客Docker 镜像公告与技术博客
专业版 · 高速稳定拉取镜像
高速镜像下载·在线技术支持·99.95% SLA 保障·付费会员免广告
50GB 仅 ¥7/年
专业版 · 高速稳定拉取镜像
50GB 仅 ¥7/年
高速镜像下载·在线技术支持·99.95% SLA 保障·付费会员免广告
用户协议·隐私政策·增值电信业务经营许可证:浙B2-20261007·©2024-2026 源码跳动©2024-2026 杭州源码跳动科技有限公司·商务合作:点击复制邮箱

更多 ufm-plugin-tfs 镜像推荐

grafana/fluent-bit-plugin-loki logo

grafana/fluent-bit-plugin-loki

Grafana 可观测性平台
暂无描述
10 次收藏1亿+ 次下载
10 天前更新
intel/intel-gpu-plugin logo

intel/intel-gpu-plugin

intel
Intel GPU设备插件是一款为Kubernetes集群开发的组件,旨在实现对Intel GPU资源的识别、管理与高效调度,支持部署GPU加速的工作负载,包括AI模型训练、高性能计算、数据分析等任务,并通过优化资源分配和实时监控,提升集群中GPU资源的利用率及相关工作负载的运行效率。
16 次收藏1000万+ 次下载
1 个月前更新
rocm/k8s-device-plugin logo

rocm/k8s-device-plugin

rocm
Kubernetes (k8s)设备插件,用于将AMD GPU注册到容器集群中,支持计算工作负载调度
7 次收藏500万+ 次下载
2 天前更新
kasmweb/kasm-network-plugin logo

kasmweb/kasm-network-plugin

kasmweb
暂无描述
1 次收藏100万+ 次下载
4 天前更新
grafana/fluent-plugin-loki logo

grafana/fluent-plugin-loki

Grafana 可观测性平台
暂无描述
1 次收藏50万+ 次下载
10 天前更新
rancher/ui-plugin-operator logo

rancher/ui-plugin-operator

rancher
暂无描述
100万+ 次下载
1 年前更新

查看更多 ufm-plugin-tfs 相关镜像