
neshkeev/hadoop免责声明:
本软件由 neshkeev 打包。产品中提及的相关商标归各自公司所有,使用这些商标并不意味着任何关联或背书。
仓库中提供了功能完整的 docker-compose.yml 文件。可按以下方式使用它运行应用:
bashcurl -sSL [***] > docker-compose.yml docker compose up
Apache Hadoop 软件库是一个框架,允许使用简单的编程模型在计算机集群上分布式处理大型数据集。
此打包镜像非常适合演示、测试或教学目的,因为它在单个 Docker 镜像中包含了完整的 Hadoop 发行版。客户端应用程序可以使用 Hadoop MapReduce 和 Hadoop 分布式文件系统 (HDFS) 执行基本操作。
该 Docker 镜像可用于在以下架构上运行 Hadoop 集群:
amd64aarch64/arm64| 标签 | 支持平台 | 描述 |
|---|---|---|
| latest, jdk-11, 3.3.6-jdk-11 | linux/amd64, linux/arm64 | Apache Hadoop 3.6.6,基于 x86-64 架构的 Amazon Corretto JDK 11 on Amazon Linux 2023 或 arm64 架构的 Bellsoft Liberica JDK 11 on CentOS 7 |
| jdk-8, 3.3.6-jdk-8 | linux/amd64, linux/arm64 | Apache Hadoop 3.6.6,基于 x86-64 架构的 Amazon Corretto JDK 1.8 on Amazon Linux 2023 或 arm64 架构的 Bellsoft Liberica JDK 1.8 on CentOS 7 |
| 3.3.5-jdk-11 | linux/amd64, linux/arm64 | Apache Hadoop 3.6.6,基于 x86-64 架构的 Amazon Corretto JDK 11 on Amazon Linux 2023 或 arm64 架构的 Bellsoft Liberica JDK 11 on CentOS 7 |
| 3.3.5-jdk-8 | linux/amd64, linux/arm64 | Apache Hadoop 3.6.6,基于 x86-64 架构的 Amazon Corretto JDK 1.8 on Amazon Linux 2023 或 arm64 架构的 Bellsoft Liberica JDK 1.8 on CentOS 7 |
| 3.2.4-jdk-8 | linux/amd64 | Apache Hadoop 3.6.6,基于 x86-64 架构的 Amazon Corretto JDK 1.8 on Amazon Linux 2023 或 arm64 架构的 Bellsoft Liberica JDK 1.8 on CentOS 7 |
| 3.2.4-jdk-11 | linux/amd64 | Apache Hadoop 3.6.6,基于 x86-64 架构的 Amazon Corretto JDK 11 on Amazon Linux 2023 或 arm64 架构的 Bellsoft Liberica JDK 11 on CentOS 7 |
| 2.10.2-jdk-11 | linux/amd64 | Apache Hadoop 3.6.6,基于 x86-64 架构的 Amazon Corretto JDK 11 on Amazon Linux 2023 |
| 2.10.2-jdk-8 | linux/amd64 | Apache Hadoop 3.6.6,基于 x86-64 架构的 Amazon Corretto JDK 1.8 on Amazon Linux 2023 |
配置 Hadoop 集群有两种可组合使用的方式:
可挂载已准备好的配置文件:
core-site.xml -> /opt/hadoop/etc/hadoop/core-site.xmlhdfs-site.xml -> /opt/hadoop/etc/hadoop/hdfs-site.xmlyarn-site.xml -> /opt/hadoop/etc/hadoop/yarn-site.xmlmapred-site.xml -> /opt/hadoop/etc/hadoop/mapred-site.xml可通过环境变量修改现有配置文件。
要修改配置属性,需构造名称符合以下模式的环境变量:前缀 + 配置名称。
例如,fs.defaultFS 的值应存储在 CORE-SITE.XML_fs.defaultFS 环境变量中,如下所示:
CORE-SITE.XML_fs.defaultFS=hdfs://namenode:9000
前缀由配置所属的文件派生而来。可参考示例中的 docker-compose.yml 文件。
环境变量的值优先于挂载的配置文件。
docker-compose.yml:bashcurl -sSL [***] > docker-compose.yml
bashdocker compose up
hadoop docker compose 服务:bashdocker compose exec -it hadoop bash
bashyarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar pi 10 15
http://localhost:9870/explorer.htmlhttp://localhost:8088hadoop docker 容器:exit
docker compose down
运行 Hadoop 发行版默认包含的 grep 示例:
docker-compose.yml:bashcurl -sSL [***] > docker-compose.yml
bashdocker compose up
healthy:bashdocker compose ps
hadoop docker compose 服务:bashdocker compose exec -it hadoop bash
bashhdfs dfs -mkdir -p /user/hadoop
bashhdfs dfs -mkdir -p input
bashhdfs dfs -put -f /opt/hadoop/etc/hadoop/*.xml input
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-*.jar grep input output 'dfs[a-z.]+'
http://localhost:9870/explorer.htmlhttp://localhost:8088bashhdfs dfs -cat output/*
bashhdfs dfs -get output ~/output
bashfind ~/output
hdfs dfs -rm -r output
resourcemanager docker 容器:exit
docker compose down
bashcurl -sSL [***] > docker-compose.yml docker compose up -d
bashjconsole
localhost:59870localhost:59864localhost:58088localhost:58042localhost:59888



探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
manifest unknown
no matching manifest(架构)
TLS 证书失败
DNS 超时
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务