
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
本Docker镜像用于运行Chronon Feature Service,提供特征获取功能。该服务允许用户通过HTTP端点获取Chronon Join和GroupBy的特征数据,支持批量查询,并可集成监控和性能分析工具,适用于机器学习特征工程、在线特征服务等场景。
获取最新版本镜像:
bashdocker pull docker.xuanyuan.run/ziplineai/chronon-fetcher:latest
基础启动命令(默认端口9000):
bashdocker run \ -p 9000:9000 \ docker.xuanyuan.run/ziplineai/chronon-fetcher:latest
可通过-e "VAR=VALUE"语法设置以下环境变量:
Google Cloud配置
| 环境变量 | 描述 | 默认值 |
|---|---|---|
| GCP_PROJECT_ID | Google Cloud BigTable项目ID | `` |
| GOOGLE_CLOUD_PROJECT | Google Cloud BigTable项目ID | `` |
| GCP_BIGTABLE_INSTANCE_ID | Google Cloud BigTable实例ID | `` |
| GOOGLE_APPLICATION_CREDENTIALS | GCloud应用凭证JSON文件路径 | https://cloud.google.com/docs/authentication/application-default-credentials#GAC |
Profiler配置
| 环境变量 | 描述 | 默认值 |
|---|---|---|
| ENABLE_GCLOUD_PROFILER | 是否启用Google Cloud Profiler(设为'true'启用) | https://cloud.google.com/profiler/docs/about-profiler |
服务指标配置
| 环境变量 | 描述 | 默认值 |
|---|---|---|
| CHRONON_METRICS_READER | 指标读取器类型,可选'http'或'prometheus' | `` |
| EXPORTER_OTLP_ENDPOINT | 使用'http'指标读取器时,OTLP HTTP导出端点 | https://github.com/open-telemetry/opentelemetry-collector/tree/main/exporter/otlphttpexporter |
| CHRONON_PROMETHEUS_SERVER_PORT | 使用'prometheus'指标读取器时,Chronon库指标暴露端口 | https://opentelemetry.io/docs/specs/otel/metrics/sdk_exporters/prometheus/ |
| VERTX_PROMETHEUS_SERVER_PORT | 使用'prometheus'指标读取器时,Vert.x webservice指标暴露端口 | https://opentelemetry.io/docs/specs/otel/metrics/sdk_exporters/prometheus/ |
监控配置
| 环境变量 | 描述 | 默认值 |
|---|---|---|
| FETCHER_OOC_TOPIC_INFO | Kafka主题字符串,格式:kafka://my-topic-name/key1=value1/key2=value2,用于输出在线离线一致性特征日志 | 文档 |
Chronon库和Vert.x fetcher web服务支持通过https://opentelemetry.io/%E6%A0%87%E5%87%86%E6%94%B6%E9%9B%86%E6%8C%87%E6%A0%87%EF%BC%8C%E5%BD%93%E5%89%8D%E6%94%AF%E6%8C%81%E4%B8%A4%E7%A7%8D%E5%AF%BC%E5%87%BA%E6%96%B9%E5%BC%8F%EF%BC%9A
OTLP over HTTP:通过EXPORTER_OTLP_ENDPOINT环境变量配置端点,将指标推送(push)到指定OTLP端点。
Prometheus:通过CHRONON_PROMETHEUS_SERVER_PORT和VERTX_PROMETHEUS_SERVER_PORT环境变量配置端口,在指定端口暴露Prometheus端点,供指标拉取(pull)。
通过设置ENABLE_GCLOUD_PROFILER环境变量为true,可使用https://cloud.google.com/profiler/docs/about-profiler%E5%AF%B9%E6%9C%8D%E5%8A%A1%E8%BF%9B%E8%A1%8C%E6%80%A7%E8%83%BD%E5%88%86%E6%9E%90%E3%80%82%E5%88%86%E6%9E%90%E7%BB%93%E6%9E%9C%E5%B0%86%E5%AF%BC%E5%87%BA%E5%88%B0%E6%9C%8D%E5%8A%A1%E5%90%8D%E7%A7%B0%E4%B8%BA'chronon-fetcher'%E7%9A%84Cloud Profiler中。
服务暴露以下HTTP端点:
| 请求方法 | 端点 | 描述 |
|---|---|---|
| GET | /ping | 健康检查端点 |
| GET | /config | Fetcher服务配置信息 |
| GET | /v1/joins | 在线Chronon joins列表 |
| GET | /v1/join/:name/schema | 返回指定Join的 schema 信息(包含Join名称、实体键schema(Avro字符串)、值schema(Avro字符串)、schema哈希) |
| POST | /v1/fetch/groupby/:name | 获取指定GroupBy的特征 |
| POST | /v1/fetch/join/:name | 获取指定Join的特征 |
以下是服务端点的curl调用示例。fetch join和GroupBy端点支持批量查询,可在单个请求中传递多个实体键以获取多个实体的特征。
bash# 获取在线joins列表 $ curl http://localhost:9000/v1/joins {"joinNames":["search.ranking_listing","search.recommendation_v1"]} # 获取指定join的schema $ curl http://localhost:9000/v1/join/search.ranking_listing/schema | jq { "joinName": "search.ranking_listing", "keySchema": "...", "valueSchema": "...", "schemaHash": "c72b6d", ... } # 批量获取join特征 $ curl -X POST http://localhost:9000/v1/fetch/join/ranking_listing -H 'Content-Type: application/json' -d '[{"listing_id":"***"}]' | jq { "results": [ { "status": "Success", "entityKeys": { "listing_id": "***" }, "features": { "my_feature_1": 1, "my_feature_2": 0.5 ... } } ] }
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务