
Apache Airflow(简称 Airflow)是一个用于可编程地编排、调度和监控工作流的平台。
当工作流以代码形式定义时,其可维护性、可版本化、可测试性和协作性都会显著提升。Airflow 支持将工作流编写为有向无环图(DAG)任务,调度器会根据任务依赖关系,在一组工作节点上执行任务。通过丰富的命令行工具,可轻松对 DAG 进行复杂操作;直观的用户界面则便于可视化生产环境中的任务流水线、监控进度及排查问题。
Airflow 最适用于静态且变化缓慢的工作流场景。当 DAG 结构在多次运行中保持一致时,能更清晰地体现工作单元和连续性。类似工具包括 Luigi、Oozie 和 Azkaban。
在数据处理中,Airflow 建议任务应具备幂等性(即任务结果一致,不会在目标系统中产生重复数据),且避免在任务间传递大量数据(但可通过 Airflow 的 XCom 功能传递元数据)。对于高容量、数据密集型任务,最佳实践是委托给专注此类工作的外部服务处理。
Airflow 本身并非流处理解决方案,但常被用于实时数据处理场景——通过批量拉取流数据进行处理。
如需安装、入门或学习完整教程,可参考 Airflow 官方文档(最新 稳定版):
关于 Airflow 改进提案(AIPs),可访问 Airflow Wiki。
依赖项目(如提供方包、Docker 镜像、Helm Chart)的文档,可在 文档索引 中查询。
以下是 apache/airflow 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 版本下载页面。


探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务