apache/beam_go_sdkApache Beam是一个统一的模型,用于定义批处理和流处理数据并行处理管道,以及一组特定于语言的SDK和用于在分布式处理后端执行管道的Runner。本容器镜像提供Apache Beam Go SDK的工作器环境,作为运行Beam管道的工作节点,支持Go语言编写的批处理与流处理任务在分布式系统中执行。
拉取最新版本镜像:
bashdocker pull apache/beam_go_sdk:latest
指定版本拉取(例如2.40.0):
bashdocker pull apache/beam_go_sdk:2.40.0
适用于开发测试,直接在容器内运行管道:
bashdocker run -it --rm \ -v /本地管道代码目录:/pipeline \ apache/beam_go_sdk:latest \ go run /pipeline/main.go --runner=DirectRunner
说明:
/本地管道代码目录需替换为本地Go语言Beam管道代码所在路径,通过卷挂载至容器内执行。
连接外部Flink集群执行管道:
bashdocker run -it --rm \ -e FLINK_MASTER=flink-jobmanager:8081 \ -v /本地管道代码目录:/pipeline \ apache/beam_go_sdk:latest \ go run /pipeline/main.go --runner=FlinkRunner --flinkMaster=flink-jobmanager:8081
| 参数名 | 描述 | 示例值 |
|---|---|---|
--runner | 指定管道执行器类型 | DirectRunner, FlinkRunner, DataflowRunner |
--project | GCP项目ID(DataflowRunner必填) | my-gcp-project-123 |
--region | 云服务区域(DataflowRunner必填) | us-central1 |
--flinkMaster | Flink集群JobManager地址 | flink-jobmanager:8081 |
--sparkMaster | Spark集群Master地址 | spark://spark-master:7077 |

manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务