
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
针对 http://hadoop.apache.org 应用的 Docker 镜像,用于提供 Hadoop 服务。
详细信息可参照:http://hadoop.apache.org/docs/r1.0.4/cn/
!hadoop-logo
版本信息:
镜像信息
本镜像为 Hadoop 的基础镜像,具体使用需要参照相关 Node 的使用说明。相应 Node 主要为:
镜像默认提供以下数据卷定义,默认数据分别存储在自动生成的应用名对应Hadoop子目录中:
shell/var/log # Hadoop 日志文件 /srv/conf # Hadoop 配置文件 /srv/data # Hadoop 数据文件
如果需要持久化存储相应数据,需要在宿主机建立本地目录,并在使用镜像初始化容器时进行映射。宿主机相关的目录中如果不存在对应应用的子目录或相应数据文件,则容器会在初始化时创建相应目录及文件。
Hadoop 应用的参数通过设置环境变量的方式设置。格式为 <PREFIX>_<PROPERTY>。使用不同的前缀设置不同的配置文件,**PREFIX**与配置文件对应关系如下:
CORE_CONF: /srv/conf/hadoop/core-site.xmlHDFS_CONF: /srv/conf/hadoop/hdfs-site.xmlYARN_CONF : /srv/conf/hadoop/yarn-site.xmlHTTPFS_CONF : /srv/conf/hadoop/httpfs-site.xmlKMS_CONF : /srv/conf/hadoop/kms-site.xmlMAPRED_CONF : /srv/conf/hadoop/mapred-site.xml容器的环境变量可通过两种方式设置:
hadoop.env-e参数指定各个变量(不适合大量变量的设置)PROPETY:
在设置环境变量时,对特殊字符需要进行转义;使用 docker 或 docker-compose 启动容器时,环境变量与设置的属性转义规则如下:
_ ==> . : 环境变量中的下划线会被转义为设置属性中的半角点__ ==> _ : 环境变量中的双下划线会被转义为设置属性中的单下划线___ ==> - : 环境变量中的三下划线会被转义为设置属性中的中划线例如如下的环境变量及对应设置的实际属性为:
CORE_CONF_fs_defaultFS=hdfs://namenode:8020 :设置配置文件core-site.xml中fs.defaultFS属性,设置后类似如下:
xml<property><name>fs.defaultFS</name><value>hdfs://namenode:8020</value></property>
YARN_CONF_yarn_log___aggregation___enable=true :设置配置文件yarn-site.xml中yarn.log-aggregation-enable属性,设置后类似如下:
xml<property><name>yarn.log-aggregation-enable</name><value>true</value></property>
以下配置参数,如果设置,将批量设置对应的配置属性:
MULTIHOMED_NETWORK
默认值:1。配置 Hadoop 集群在使用不同的网络时,可以正常访问;设置的配置文件及对应属性如下:
配置文件 /srv/conf/hadoop/hdfs-site.xml:
配置文件 /srv/conf/hadoop/yarn-site.xml:
配置文件 /srv/conf/hadoop/mapred-site.xml:
GANGLIA_HOST
默认值:无。配置 Hadoop 将对应的度量数据发送至指定的 ganglia gmond 守护服务。
如果没有必要,可选配置参数可以不用定义,直接使用对应的默认值,主要包括:
ENV_DEBUG
默认值:false。设置是否输出容器调试信息。可设置为:1、true、yes
本容器默认使用应用对应的运行时用户及用户组运行应用,以加强容器的安全性。在使用非root用户运行容器时,相关的资源访问会受限;应用仅能操作镜像创建时指定的路径及数据。使用Non-root方式的容器,更适合在生产环境中使用。
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务
以下是 colovu/hadoop 相关的常用 Docker 镜像,适用于 不同场景 等不同场景: