轩辕镜像 官方专业版
轩辕镜像
专业版
轩辕镜像 官方专业版
轩辕镜像
专业版
首页个人中心搜索镜像
交易
充值流量¥7起我的订单
文档
工具
提交工单页面收录
airflow

fikolis/airflow

fikolis

Apache Airflow是开源工作流管理平台,用于编排、调度和监控数据处理流程,支持基于DAG定义任务依赖,适用于ETL、数据分析等自动化任务的可视化管理与执行。

下载次数: 0状态:社区镜像维护者:fikolis仓库类型:镜像最近更新:1 年前
让 AI 帮你使用轩辕镜像? · 展开查看说明 · 点击收起说明

如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。

只需在 AI 对话中先发送下面这句话即可:

请先完整阅读并严格遵守以下文档中的全部规则与要求:

https://xuanyuan.cloud/agents.md

在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。

查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。

中文简介
下载命令
镜像标签列表与下载命令
轩辕镜像,不浪费每一次拉取。
点击查看

Apache Airflow Docker镜像文档

1. 镜像概述和主要用途

Apache Airflow是一款开源的工作流编排平台,用于以代码形式定义、调度和监控复杂工作流。Airflow Docker镜像是官方提供的容器化分发版本,旨在简化Airflow的部署流程,确保环境一致性,并支持快速集成到容器化基础设施中。

主要用途:

  • 提供开箱即用的Airflow运行环境,避免手动配置依赖(如Python库、数据库驱动等)
  • 支持单机或分布式部署模式,适配不同规模的工作流需求
  • 便于在开发、测试和生产环境中快速迁移和扩展

2. 核心功能和特性

2.1 工作流定义与调度

  • 基于Python代码定义工作流(DAG,有向无环图),支持版本控制和代码复用
  • 灵活的调度策略:支持定时触发(Cron表达式)、依赖触发、外部事件触发

2.2 执行引擎

  • 多执行器支持:SequentialExecutor(单机单进程)、LocalExecutor(单机多进程)、CeleryExecutor(分布式)、KubernetesExecutor(容器编排)
  • 任务隔离:支持DockerOperator、KubernetesPodOperator等,实现任务级环境隔离

2.3 监控与可视化

  • 内置Web UI:实时展示工作流状态、任务日志、依赖关系图
  • 告警机制:支持Email、Slack、PagerDuty等多渠道任务失败告警

2.4 可扩展性

  • 插件生态:支持自定义操作符(Operator)、钩子(Hook)、传感器(Sensor)
  • 元数据存储:兼容PostgreSQL、MySQL等关系型数据库,支持高可用配置

3. 使用场景和适用范围

3.1 典型使用场景

  • 数据处理管道:ETL/ELT流程编排(如数据抽取、清洗、加载)
  • 定时任务调度:替代传统Cron任务,管理复杂依赖(如"任务B需在任务A和C完成后执行")
  • 跨系统协同:串联多系统操作(如调用API、触发Spark作业、同步数据库)
  • 合规与审计:记录任务执行历史、日志留存,满足数据合规要求

3.2 适用范围

  • 用户角色:数据工程师、DevOps工程师、数据科学家、SRE
  • 行业领域:互联网、***、电商、***等需处理大规模数据或复杂流程的场景
  • 基础设施:单机部署(小流量测试)、分布式集群(生产环境)、云原生环境(K8s集成)

4. 详细使用方法和配置说明

4.1 获取镜像

Airflow官方镜像托管于Docker Hub,默认标签为apache/airflow:latest。建议指定具体版本(如apache/airflow:2.8.0)以确保稳定性。

bash
# 拉取最新版镜像
docker pull apache/airflow:latest

# 拉取指定版本镜像
docker pull apache/airflow:2.8.0

4. 详细使用方法和配置说明

4.1 获取镜像

Airflow官方镜像托管于Docker Hub,默认标签为apache/airflow:latest。建议指定具体版本(如apache/airflow:2.8.0)以确保稳定性。

bash
# 拉取最新版镜像
docker pull apache/airflow:latest

# 拉取指定版本镜像
docker pull apache/airflow:2.8.0

4.2 基本运行命令(docker run)

以下示例为单机测试场景,使用默认SequentialExecutor和SQLite元数据库(生产环境需替换为PostgreSQL/MySQL)。

4.2.1 初始化数据库

首次运行需初始化元数据库(存储工作流元数据、任务状态等):

bash
docker run --rm \
  -e AIRFLOW__CORE__EXECUTOR=SequentialExecutor \
  -e AIRFLOW__DATABASE__SQL_ALCHEMY_CONN=sqlite:////opt/airflow/airflow.db \
  -e _AIRFLOW_DB_UPGRADE=true \
  -v ./dags:/opt/airflow/dags \  # 挂载本地DAG目录
  apache/airflow:latest

4.2.2 启动Web服务和调度器

初始化完成后,启动Web UI(端口8080)和调度器(负责任务触发):

bash
docker run -d \
  --name airflow-webserver \
  -p 8080:8080 \  # Web UI端口映射
  -e AIRFLOW__CORE__EXECUTOR=SequentialExecutor \
  -e AIRFLOW__DATABASE__SQL_ALCHEMY_CONN=sqlite:////opt/airflow/airflow.db \
  -e AIRFLOW__WEBSERVER__EXPOSE_CONFIG=true \  # Web UI显示配置详情
  -v ./dags:/opt/airflow/dags \
  -v ./logs:/opt/airflow/logs \  # 挂载日志目录(持久化任务日志)
  apache/airflow:latest webserver

docker run -d \
  --name airflow-scheduler \
  -e AIRFLOW__CORE__EXECUTOR=SequentialExecutor \
  -e AIRFLOW__DATABASE__SQL_ALCHEMY_CONN=sqlite:////opt/airflow/airflow.db \
  -v ./dags:/opt/airflow/dags \
  -v ./logs:/opt/airflow/logs \
  apache/airflow:latest scheduler

4.3 Docker Compose配置示例

生产环境建议使用docker-compose管理多组件(如Web服务、调度器、元数据库、消息队列)。以下为基于CeleryExecutor的分布式部署示例(需PostgreSQL+Redis):

docker-compose.yml

yaml
version: '3.8'

x-airflow-common: &airflow-common
  image: apache/airflow:2.8.0
  environment: &airflow-common-env
    AIRFLOW__CORE__EXECUTOR: CeleryExecutor
    AIRFLOW__DATABASE__SQL_ALCHEMY_CONN: postgresql+psycopg2://airflow:airflow@postgres/airflow
    AIRFLOW__CELERY__BROKER_URL: redis://:@redis:6379/0
    AIRFLOW__CORE__LOAD_EXAMPLES: 'false'  # 禁用示例DAG
    AIRFLOW__WEBSERVER__EXPOSE_CONFIG: 'true'
    _AIRFLOW_DB_UPGRADE: 'true'  # 启动时自动升级数据库
    _AIRFLOW_WWW_USER_CREATE: 'true'  # 创建默认管理员用户
    _AIRFLOW_WWW_USER_USERNAME: admin  # 管理员用户名
    _AIRFLOW_WWW_USER_PASSWORD: admin  # 管理员密码(生产环境需修改)
  volumes:
    - ./dags:/opt/airflow/dags
    - ./logs:/opt/airflow/logs
    - ./plugins:/opt/airflow/plugins  # 挂载自定义插件目录
  depends_on:
    - postgres
    - redis

services:
  postgres:  # 元数据库(存储工作流状态)
    image: postgres:15
    environment:
      POSTGRES_USER: airflow
      POSTGRES_PASSWORD: airflow
      POSTGRES_DB: airflow
    volumes:
      - postgres-db-volume:/var/lib/postgresql/data

  redis:  # Celery消息队列(分发任务)
    image: redis:latest
    ports:
      - "6379:6379"
    healthcheck:
      test: ["CMD", "redis-cli", "ping"]
      interval: 30s
      timeout: 30s
      retries: 3

  airflow-webserver:  # Web UI服务
    <<: *airflow-common
    command: webserver
    ports:
      - "8080:8080"
    healthcheck:
      test: ["CMD", "curl", "--fail", "http://localhost:8080/health"]
      interval: 30s
      timeout: 30s
      retries: 3
    restart: always

  airflow-scheduler:  # 调度器
    <<: *airflow-common
    command: scheduler
    restart: always

  airflow-worker:  # 任务执行节点(可横向扩展多个实例)
    <<: *airflow-common
    command: celery worker
    restart: always

  airflow-init:  # 初始化服务(仅首次运行)
    <<: *airflow-common
    command: version
    environment:
      <<: *airflow-common-env
      _AIRFLOW_DB_UPGRADE: 'true'
      _AIRFLOW_WWW_USER_CREATE: 'true'
      _AIRFLOW_WWW_USER_USERNAME: admin
      _AIRFLOW_WWW_USER_PASSWORD: admin

volumes:
  postgres-db-volume:

启动步骤

bash
# 初始化目录权限(避免容器内权限问题)
mkdir -p ./dags ./logs ./plugins
chmod -R 777 ./dags ./logs ./plugins  # 生产环境需按需调整权限

# 启动所有服务
docker-compose up -d

# 查看服务状态
docker-compose ps

4.4 核心环境变量说明

Airflow通过环境变量配置核心参数,格式为AIRFLOW__<SECTION>__<KEY>(SECTION对应配置文件章节,KEY对应具体配置项)。常用变量如下:

环境变量说明默认值/示例
AIRFLOW__CORE__EXECUTOR执行器类型SequentialExecutor/CeleryExecutor
AIRFLOW__DATABASE__SQL_ALCHEMY_CONN元数据库连接串postgresql+psycopg2://user:pass@host/db
AIRFLOW__CELERY__BROKER_URLCelery消息队列地址(CeleryExecutor需配置)redis://:@redis:6379/0
AIRFLOW__WEBSERVER__EXPOSE_CONFIGWeb UI是否显示配置详情false/true
AIRFLOW__CORE__LOAD_EXAMPLES是否加载示例DAGtrue/false
_AIRFLOW_DB_UPGRADE容器启动时是否执行airflow db upgradetrue(初始化数据库)
_AIRFLOW_WWW_USER_CREATE是否创建Web UI管理员用户true
_AIRFLOW_WWW_USER_USERNAME管理员用户名admin
_AIRFLOW_WWW_USER_PASSWORD管理员密码admin(生产环境必须修改)

4.5 数据持久化

Airflow需持久化的数据包括:

  • DAG文件:挂载本地目录至容器/opt/airflow/dags(如-v ./dags:/opt/airflow/dags)
  • 任务日志:挂载本地目录至容器/opt/airflow/logs(如-v ./logs:/opt/airflow/logs)
  • 元数据库数据:通过外部数据库(如PostgreSQL)持久化(避免使用SQLite,不支持多进程访问)

4.6 Web UI访问

Web UI默认监听容器内8080端口,通过宿主机端口映射访问(如http://localhost:8080)。登录用户为环境变量_AIRFLOW_WWW_USER_USERNAME和_AIRFLOW_WWW_USER_PASSWORD配置的值(默认admin/admin)。

Web UI功能包括:

  • DAG列表与状态监控
  • 任务实例日志查看
  • 工作流依赖图(Graph View)
  • 任务调度历史(Tree View)

5. 注意事项

  • 数据库选择:生产环境必须使用PostgreSQL或MySQL作为元数据库,SQLite仅支持SequentialExecutor且不适合多进程场景。
  • 安全配置:默认管理员密码需修改,Web UI建议通过反向代理(如Nginx)配置HTTPS,并限制访问IP。
  • 资源规划:调度器(scheduler)和工作节点(worker)需根据任务数量分配CPU/内存资源,避免资源不足导致任务延迟。
  • 版本兼容性:升级镜像前需参考https://airflow.apache.org/docs/apache-airflow/stable/upgrading.html%EF%BC%8C%E9%81%BF%E5%85%8D%E9%85%8D%E7%BD%AE%E9%A1%B9%E5%8F%98%E6%9B%B4%E5%AF%BC%E8%87%B4%E5%85%BC%E5%AE%B9%E9%97%AE%E9%A2%98%E3%80%82
  • 日志管理:大规模部署时建议集成ELK Stack或云日志服务,避免本地日志目录过大。

镜像拉取方式

您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。

轩辕镜像加速拉取命令点我查看更多 airflow 镜像标签

docker pull docker.xuanyuan.run/fikolis/airflow:<标签>

使用方法:

  • 登录认证方式
  • 免认证方式

DockerHub 原生拉取命令

docker pull fikolis/airflow:<标签>

轩辕镜像配置手册

按平台快速找到配置文档

Docker

登录仓库拉取

登录认证 · 私有仓库

专属域名拉取

免登录 · 高速拉取

Linux

Docker 镜像配置

Windows / Mac

Docker Desktop 配置

MacOS OrbStack

OrbStack 容器

Docker Compose

Compose 项目配置

NAS

群晖

Synology 配置

飞牛

fnOS 镜像配置

绿联

绿联 NAS

威联通

QNAP 配置

极空间

极空间 NAS

企业仓库

其他仓库

ghcr · Quay · nvcr

Harbor 镜像源

Proxy Repository 对接

Portainer 镜像源

Registries 配置

Nexus 镜像源

Docker Proxy 缓存

开发工具

Dev Containers

VS Code 开发容器

Podman

Podman 配置指南

Singularity / Apptainer

HPC 科学计算容器

Kubernetes

K8s Containerd

Kubernetes · Containerd

K3s

轻量级集群

面板 / 网络

爱快路由

iKuai 镜像加速

宝塔面板

一键配置镜像源

AI

用 AI 使用轩辕镜像

agents.md · AI 对话 · 提示词

一键安装

一键安装 Docker

Linux Docker 一键安装

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

功能

版本功能对比

功能对比 · 版本选择

支持的镜像仓库

Docker Hub · GCR · GHCR

新手拉取配置

登录 · 专属域名 · 配置

docker search 限制

专属域名 · Hub 搜索

不支持 push

仅支持 pull · 不支持

拉取速度原因

带宽 · 缓存 · 冷热镜像

错误码

402 与流量用尽

402 · 流量包 · 充值

401 认证失败

401 · docker login

manifest unknown

标签错误 · 镜像不存在

410 Gone 排查

410 · Docker 升级

429 限流

免费版 · 请求频率

其他报错

DNS 超时

DNS 解析 · 网络超时

TLS 证书失败

no matching manifest(架构)

账号

失败是否计费

manifest · blob · 计费

申请开发票(企业 / 个人)

企业 · 个人 · 工单

修改登录密码

网站 · 仓库 · 重置

注销账户

工单 · 数据 · 注销

原理

mirrors 不生效

daemon.json · 重启

去掉域名前缀

docker tag · 重命名

指定架构拉取

ARM64 · AMD64 · 多架构

latest 与「最新」

digest · 版本号 · 标签

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
fikolis/airflow
教程轩辕镜像功能与使用教程
定价查看流量套餐与价格
热门查看热门 Docker 镜像推荐
博客Docker 镜像公告与技术博客
专业版 · 高速稳定拉取镜像
高速镜像下载·在线技术支持·99.95% SLA 保障·付费会员免广告
50GB 仅 ¥7/年
专业版 · 高速稳定拉取镜像
50GB 仅 ¥7/年
高速镜像下载·在线技术支持·99.95% SLA 保障·付费会员免广告
商务合作:点击复制邮箱
用户协议·隐私政策·©2024-2026 源码跳动
用户协议·隐私政策©2024-2026 杭州源码跳动科技有限公司商务合作:点击复制邮箱

更多 airflow 镜像推荐

apache/airflow logo

apache/airflow

Apache 软件基金会镜像
Apache Airflow是一个开源的工作流编排平台,旨在通过编程方式(主要使用Python)定义、调度和监控复杂工作流,它以有向无环图(DAG)形式管理任务依赖关系,支持灵活的调度策略(如基于时间、事件或依赖),提供直观的Web界面用于任务状态监控与管理,具备高度可扩展性,可集成多种数据处理工具、云服务及外部系统,广泛应用于数据管道构建、ETL流程自动化、机器学习工作流编排等场景,帮助用户高效管理和执行复杂的任务流程。
630 次收藏10亿+ 次下载
28 天前更新
bitnamicharts/airflow logo

bitnamicharts/airflow

bitnamicharts
Bitnami提供的Apache Airflow Helm chart,用于在Kubernetes环境中便捷部署和管理工作流编排平台。
5 次收藏100万+ 次下载
10 个月前更新
localstack/airflow logo

localstack/airflow

localstack
Custom builds of Airflow for use with LocalStack
8.2千+ 次下载
5 个月前更新
opensourcemano/airflow logo

opensourcemano/airflow

opensourcemano
该Docker镜像包含ETSI OSM项目软件及基础发行版的Bash等依赖组件,遵循OSM软件许可证,适用于OSM相关应用的运行与开发。
10万+ 次下载
9 天前更新
ubuntu/airflow logo

ubuntu/airflow

Ubuntu 官方镜像
基于Ubuntu的Apache Airflow Docker镜像,提供工作流管理平台,用于数据工程管道的程序化创作、调度和监控。
1.8千+ 次下载
1 个月前更新
bitnami/airflow logo

bitnami/airflow

Bitnami Secure Images(VMware Tanzu)
Bitnami Airflow 安全镜像
78 次收藏1000万+ 次下载
10 个月前更新

查看更多 airflow 相关镜像

更多相关 Docker 镜像与资源

以下是 fikolis/airflow 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:

  • apache/airflow Docker 镜像说明(Apache Airflow,工作流调度平台)
  • ubuntu/airflow Docker 镜像说明(Ubuntu 官方 Apache Airflow,适合工作流调度与数据管道编排)
  • bitnami/airflow Docker 镜像说明(Bitnami Apache Airflow,适合数据管道与工作流调度)
  • bitnamicharts/airflow Docker 镜像说明(Bitnami Airflow 图表栈,适合数据管道 Helm 部署)
  • bitnami/spark Docker 镜像说明(Apache Spark 大数据处理引擎,Bitnami 企业级配置)