Apache Airflow是一个开源的工作流编排平台,旨在通过编程方式(主要使用Python)定义、调度和监控复杂工作流,它以有向无环图(DAG)形式管理任务依赖关系,支持灵活的调度策略(如基于时间、事件或依赖),提供直观的Web界面用于任务状态监控与管理,具备高度可扩展性,可集成多种数据处理工具、云服务及外部系统,广泛应用于数据管道构建、ETL流程自动化、机器学习工作流编排等场景,帮助用户高效管理和执行复杂的任务流程。
收藏数: 620
下载次数: 1562645844
状态: active
发布者: apache
类型: 镜像

apache/airflowApache Airflow(简称 Airflow)是一个用于可编程地编排、调度和监控工作流的平台。
当工作流以代码形式定义时,其可维护性、可版本化、可测试性和协作性都会显著提升。Airflow 支持将工作流编写为有向无环图(DAG)任务,调度器会根据任务依赖关系,在一组工作节点上执行任务。通过丰富的命令行工具,可轻松对 DAG 进行复杂操作;直观的用户界面则便于可视化生产环境中的任务流水线、监控进度及排查问题。
Airflow 最适用于静态且变化缓慢的工作流场景。当 DAG 结构在多次运行中保持一致时,能更清晰地体现工作单元和连续性。类似工具包括 Luigi、Oozie 和 Azkaban。
在数据处理中,Airflow 建议任务应具备幂等性(即任务结果一致,不会在目标系统中产生重复数据),且避免在任务间传递大量数据(但可通过 Airflow 的 XCom 功能传递元数据)。对于高容量、数据密集型任务,最佳实践是委托给专注此类工作的外部服务处理。
Airflow 本身并非流处理解决方案,但常被用于实时数据处理场景——通过批量拉取流数据进行处理。
如需安装、入门或学习完整教程,可参考 Airflow 官方文档(最新 稳定版):
关于 Airflow 改进提案(AIPs),可访问 Airflow Wiki。
依赖项目(如提供方包、Docker 镜像、Helm Chart)的文档,可在 文档索引 中查询。
以下是 apache/airflow 相关的常用 Docker 镜像,适用于 不同场景 等不同场景:
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 版本下载页面。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
在 Linux 系统配置镜像服务
在 Docker Desktop 配置镜像
Docker Compose 项目配置
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
在宝塔面板一键配置镜像
Synology 群晖 NAS 配置
飞牛 fnOS 系统配置镜像
极空间 NAS 系统配置服务
爱快 iKuai 路由系统配置
绿联 NAS 系统配置镜像
QNAP 威联通 NAS 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
无需登录使用专属域名
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
免费版仅支持 Docker Hub 访问,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。
专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等;免费版仅支持 docker.io。
当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。
通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。
先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。
使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。
来自真实用户的反馈,见证轩辕镜像的优质服务