
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
仅用于测试目的!
该Docker镜像提供包含Hadoop集群组件的一站式容器化解决方案,支持HDFS独立部署、Yarn资源管理及Hive数据仓库集成。主要用于测试环境,可快速搭建Hadoop相关服务,支持Hadoop 2和3两个版本系列,满足不同测试需求。
mtsrus/hadoop:hadoop2.7.3-hdfs
mtsrus/hadoop:hadoop2-hdfs - 与上述版本相同
mtsrus/hadoop:hadoop3.3.6-hdfs
mtsrus/hadoop:hadoop3-hdfs - 与上述版本相同
最小资源要求:
详见https://github.com/MobileTeleSystems/hadoop-docker/blob/1.7.1/hdfs/docker-compose.yml
注意:Hadoop 2镜像与Hadoop 3使用相同端口号:
9820:9820 - HDFS IPC9870:9870 - WebHDFS/var/hadoop/conf/*.xml 文件
默认配置
可通过将自定义配置文件挂载到容器内/var/hadoop/conf目录来覆盖默认Hadoop配置。
替代变量
以下变量会被替换为实际值:
{{hostname}} - 当前主机名容器环境变量
WAIT_TIMEOUT_SECONDS=120 - 启动每个服务后检查存活状态的超时时间(秒)/var/hadoop/conf/hadoop-env.sh 环境变量
默认值
export HADOOP_HEAPSIZE=512 - 所有Hadoop组件的最大JVM内存(MB),如无单独配置则应用此值若容器因OutOfMemory失败,应增加此值,例如设为1024或2048。
服务专用变量
export HADOOP_NAMENODE_OPTS=-Xmx2048m - NameNode的最大JVM内存export HADOOP_SECONDARYNAMENODE_OPTS=-Xmx2048m - Secondary NameNode的最大JVM内存export HADOOP_DATANODE_OPTS=-Xmx1024m - DataNode的最大JVM内存参考:https://hadoop.apache.org/docs/r2.7.6/hadoop-project-dist/hadoop-common/ClusterSetup.html#Configuring_Environment_of_Hadoop_Daemons
mtsrus/hadoop:hadoop2.7.3-yarn
mtsrus/hadoop:hadoop2-yarn - 与上述版本相同
mtsrus/hadoop:hadoop3.3.6-yarn
mtsrus/hadoop:hadoop3-yarn - 与上述版本相同
最小资源要求:
详见https://github.com/MobileTeleSystems/hadoop-docker/blob/1.7.1/yarn/docker-compose.yml
注意:Hadoop 2镜像与Hadoop 3使用相同端口号:
9820:9820 - HDFS IPC9870:9870 - HDFS WebHDFS8042:8042 - NodeManager UI8088:8088 - Yarn UI若WITH_JOBHISTORY_SERVER=true:
10020:10020 - MapReduce JobServer19888:19888 - MapReduce JobServer History/var/hadoop/conf/*.xml 文件
默认配置
可通过将自定义配置文件挂载到容器内/var/hadoop/conf目录来覆盖默认Hadoop配置。
替代变量
以下变量会被替换为实际值:
{{hostname}} - 当前主机名容器环境变量
WAIT_TIMEOUT_SECONDS=120 - 启动每个服务后检查存活状态的超时时间(秒)WITH_JOBHISTORY_SERVER=false - 设置为true以启动MapReduce JobHistory服务器/var/hadoop/conf/hadoop-env.sh 环境变量
参见HDFS镜像文档。
/var/hadoop/conf/yarn-env.sh 环境变量
export YARN_RESOURCEMANAGER_OPTS=-Xmx1024m - Yarn ResourceManager的最大JVM内存export YARN_NODEMANAGER_OPTS=-Xmx1024m - NodeManager的最大JVM内存export HADOOP_JOB_HISTORYSERVER_OPTS=-Xmx1024m - MapReduce JobHistory服务器的最大JVM内存参考:https://hadoop.apache.org/docs/r2.7.6/hadoop-project-dist/hadoop-common/ClusterSetup.html#Configuring_Environment_of_Hadoop_Daemons
mtsrus/hadoop:hadoop2.7.3-hive2.3.10
mtsrus/hadoop:hadoop2-hive - 与上述版本相同
mtsrus/hadoop:hadoop3.3.6-hive3.1.3
mtsrus/hadoop:hadoop3-hive - 与上述版本相同
最小资源要求:
详见https://github.com/MobileTeleSystems/hadoop-docker/blob/1.7.1/hive/docker-compose.yml
注意:Hadoop 2镜像与Hadoop 3使用相同端口号:
9820:9820 - HDFS IPC9870:9870 - HDFS WebHDFS若WITH_HIVE_SERVER=true:
8042:8042 - NodeManager UI8088:8088 - Yarn UI19888:19888 - MapReduce JobServer History10000:10000 - Hive服务器10002:10002 - Hive管理UI若WITH_HIVE_METASTORE_SERVER=true:
9083:9083 - Hive Metastore服务器/var/hive/conf/*.xml 和 var/hadoop/conf/*.xml 文件
默认配置
可通过将自定义配置文件挂载到容器内/var/hive/conf目录来覆盖默认Hive配置。HDFS和Yarn配置仍可通过var/hadoop/conf目录传递。
替代变量
以下变量会被替换为实际值:
{{hostname}} - 当前主机名{{HIVE_METASTORE_DB_URL}} - HIVE_METASTORE_DB_URL环境变量(默认jdbc:postgresql://postgres:5432/metastore){{HIVE_METASTORE_DB_DRIVER}} - HIVE_METASTORE_DB_DRIVER环境变量(默认org.postgresql.Driver){{HIVE_METASTORE_DB_USER}} - HIVE_METASTORE_DB_USER环境变量(默认hive){{HIVE_METASTORE_DB_PASSWORD}} - HIVE_METASTORE_DB_PASSWORD环境变量(默认hive)Metastore数据库
Hive使用{{HIVE_METASTORE_DB_DRIVER}}指定的驱动将元数据存储在{{HIVE_METASTORE_DB_URL}}中。默认使用Postgres。
可通过设置上述环境变量更改URL组件,或通过更新/var/hive/conf/hive-site.xml文件替换整个URL。
也可使用其他支持的关系型数据库(如MySQL),方法是更改连接URL并将JDBC驱动嵌入/挂载到容器内/opt/hive/lib/drivername.jar路径。Postgres JDBC驱动已嵌入镜像中。
容器环境变量
WAIT_TIMEOUT_SECONDS=120 - 启动每个服务后检查存活状态的超时时间(秒)WITH_HIVE_SERVER=true - 设置为false以禁用Hive服务器WITH_HIVE_METASTORE_SERVER=true - 设置为false以禁用Hive Metastore服务器/var/hadoop/conf/hadoop-env.sh 环境变量
参见HDFS镜像文档。
/var/hadoop/conf/yarn-env.sh 环境变量
参见Yarn镜像文档。
/var/hive/conf/hive-env.sh 环境变量
export HIVE_SERVER2_HEAPSIZE=256 - Hive服务器的最大JVM内存(MB)export HIVE_METASTORE_HEAPSIZE=256 - Hive Metastore服务器的最大JVM内存(MB)参考:https://www.alibabacloud.com/help/en/emr/emr-on-ecs/user-guide/modify-the-memory-parameters-of-hive
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务
以下是 mtsrus/hadoop 相关的常用 Docker 镜像,适用于 不同场景 等不同场景: