本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com
Apache Beam Flink Job Server镜像基于Apache Beam和Apache Flink技术栈构建,是部署和运行Apache Beam数据处理作业的专用服务器。该镜像作为Flink后端的作业执行载体,提供作业提交、执行、监控的完整生命周期管理,支持使用Beam SDK开发的批处理(Batch)和流处理(Streaming)任务在Flink集群上高效运行。
通过以下命令快速启动单节点Job Server:
docker run -d \ -p 8099:8099 \ --name beam-flink-job-server \ -e FLINK_MASTER=localhost:8081 \ # 连接本地Flink集群JobManager -e DEFAULT_PARALLELISM=4 \ # 设置默认作业并行度 apache/beam-flink-job-server:latest
配合Flink集群部署的docker-compose配置:
version: '3.8' services: # Flink JobManager(需提前部署Flink集群) flink-jobmanager: image: flink:1.17.0 command: jobmanager environment: - JOB_MANAGER_RPC_ADDRESS=flink-jobmanager ports: - "8081:8081" # Beam Flink Job Server beam-flink-job-server: image: apache/beam-flink-job-server:latest depends_on: - flink-jobmanager ports: - "8099:8099" environment: - FLINK_MASTER=flink-jobmanager:8081 # 连接Flink JobManager - JOB_SERVER_PORT=8099 # 服务监听端口 - DEFAULT_PARALLELISM=2 # 默认并行度 - LOG_LEVEL=INFO # 日志级别
| 环境变量名 | 描述 | 默认值 |
|---|---|---|
FLINK_MASTER | Flink集群JobManager地址(格式:host:port) | localhost:8081 |
JOB_SERVER_PORT | 作业服务器监听端口 | 8099 |
DEFAULT_PARALLELISM | 作业默认并行度(任务并行执行的slot数量) | 1 |
LOG_LEVEL | 日志输出级别(DEBUG/INFO/WARN/ERROR) | INFO |
FLINK_CONFIG_DIR | Flink配置文件目录(容器内路径) | /opt/flink/conf |
MAX_PARALLELISM | 作业最大并行度限制 | 10 |
支持通过命令行参数覆盖默认配置,示例:
docker run apache/beam-flink-job-server:latest \ --flink-master flink-jobmanager:8081 \ # 指定Flink集群地址 --port 8099 \ # 指定服务端口 --default-parallelism 4 \ # 设置默认并行度 --log-level DEBUG # 开启DEBUG日志
通过Java Beam SDK提交作业至Job Server:
import org.apache.beam.runners.flink.FlinkRunner; import org.apache.beam.sdk.Pipeline; import org.apache.beam.sdk.options.PipelineOptions; import org.apache.beam.sdk.options.PipelineOptionsFactory; import org.apache.beam.sdk.options.FlinkPipelineOptions; public class BeamJobSubmitter { public static void main(String[] args) { // 创建Pipeline配置 PipelineOptions options = PipelineOptionsFactory.create(); FlinkPipelineOptions flinkOptions = options.as(FlinkPipelineOptions.class); // 配置Job Server地址 flinkOptions.setRunner(FlinkRunner.class); flinkOptions.setJobServerAddress("[***]"); // 创建Pipeline并定义作业逻辑 Pipeline pipeline = Pipeline.create(flinkOptions); pipeline.apply("Sample Source", ...) // 输入源 .apply("Data Transformation", ...) // 数据转换 .apply("Sample Sink", ...); // 输出目标 // 提交作业并等待完成 pipeline.run().waitUntilFinish(); } }
通过Python Beam SDK提交作业:
import apache_beam as beam from apache_beam.options.pipeline_options import PipelineOptions options = PipelineOptions([ '--runner=FlinkRunner', '--job_server_address=[***] ]) with beam.Pipeline(options=options) as p: (p | 'Read from Source' >> beam.io.ReadFromText('input.txt') | 'Transform Data' >> beam.Map(lambda x: x.upper()) | 'Write to Sink' >> beam.io.WriteToText('output.txt'))
免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤
在 Linux 系统上配置轩辕镜像源,支持主流发行版
在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统
在 Docker Compose 中使用轩辕镜像加速,支持容器编排
在 k8s 中配置 containerd 使用轩辕镜像加速
在宝塔面板中配置轩辕镜像加速,提升服务器管理效率
在 Synology 群晖NAS系统中配置轩辕镜像加速
在飞牛fnOS系统中配置轩辕镜像加速
在极空间NAS中配置轩辕镜像加速
在爱快ikuai系统中配置轩辕镜像加速
在绿联NAS系统中配置轩辕镜像加速
在威联通NAS系统中配置轩辕镜像加速
在 Podman 中配置轩辕镜像加速,支持多系统
配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤
无需登录即可使用轩辕镜像加速服务,更加便捷高效
需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429