
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
Beast是一个Kafka到BigQuery的接收器(Sink)工具,主要用于将Kafka集群中的消息批量、可靠地推送到BigQuery。它通过消费者、BigQuery工作器和提交器等组件协同工作,确保消息从Kafka消费、处理到BigQuery存储的完整流程,并支持无效消息的死信处理,适用于流数据持久化场景。
无效消息在GCS中的存储路径格式为:ENABLE_GCS_ERROR_SINK=true GCS_BUCKET=<谷歌云存储桶名称> GCS_PATH_PREFIX=<桶内路径前缀> GCS_WRITER_PROJECT_NAME=<包含存储桶的谷歌项目>
<GCS_WRITER_PROJECT_NAME>/<GCS_BUCKET>/<GCS_PATH_PREFIX>/<dt=yyyy-MM-dd>/<topicName>/<random-uuid>,其中<topicName>为消息来源主题,<random-uuid>为文件名。适用于需要将Kafka流数据(如系统日志、业务事件、用户行为等)持久化到BigQuery进行后续分析的场景。确保数据从Kafka到BigQuery的可靠传输,避免数据丢失,并处理异常消息。
bashgit clone https://github.com/odpf/beast export $(cat ./env/sample.properties | xargs -L1) && gradle clean runConsumer
镜像托管于https://hub.docker.com/r/odpf/beast%EF%BC%9A
bashexport TAG=release-0.1.1 docker run --env-file beast.env -v ./local_dir/project-secret.json:/var/bq-secret.json -it odpf/beast:$TAG
-v:挂载本地密钥文件project-secret.json到容器内/var/bq-secret.json,环境变量GOOGLE_CREDENTIALS需指向该路径用于BigQuery认证TAG:可更新为最新镜像标签,示例标签已通过测试为Kafka中的目标主题创建Beast部署:
Helm部署请参考https://github.com/gojektech/charts/tree/master/incubator/beast%E3%80%82
以TestMessage proto文件为例,使用schema文件创建表:
bash# 从schema创建新表 bq mk --table <project_name>:dataset_name.test_messages ./docs/test_messages.schema.json # 查询总记录数 bq query --nouse_legacy_sql 'SELECT count(*) FROM `<project_name>:dataset_name.test_messages LIMIT 10' # 从本地schema文件更新BigQuery表结构 bq update --format=prettyjson <project_name>:dataset_name.test_messages booking.schema # 导出表结构到文件 bq show --schema --format=prettyjson <project_name>:dataset_name.test_messages > test_messages.schema.json
可使用https://github.com/gojekfarm/sample-kafka-producer%E7%94%9F%E6%88%90TestMessage.proto%E6%A0%BC%E5%BC%8F%E7%9A%84%E6%B6%88%E6%81%AF%E5%B9%B6%E6%8E%A8%E9%80%81%E5%88%B0Kafka%E3%80%82
./run_descriptor_server.sh在build目录构建描述符,并启动Python服务器(默认端口8000)curl http://localhost:8000/messages.desc本地测试命令:
bashgit clone https://github.com/odpf/beast export $(cat ./env/sample.properties | xargs -L1) && gradlew test
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务