
colovu/hadoop针对 Hadoop 应用的 Docker 镜像,用于提供 Hadoop 服务。
详细信息可参照:官方说明
!hadoop-logo
版本信息:
镜像信息
本镜像为 Hadoop 的基础镜像,具体使用需要参照相关 Node 的使用说明。相应 Node 主要为:
镜像默认提供以下数据卷定义,默认数据分别存储在自动生成的应用名对应Hadoop子目录中:
shell/var/log # Hadoop 日志文件 /srv/conf # Hadoop 配置文件 /srv/data # Hadoop 数据文件
如果需要持久化存储相应数据,需要在宿主机建立本地目录,并在使用镜像初始化容器时进行映射。宿主机相关的目录中如果不存在对应应用的子目录或相应数据文件,则容器会在初始化时创建相应目录及文件。
Hadoop 应用的参数通过设置环境变量的方式设置。格式为 <PREFIX>_<PROPERTY>。使用不同的前缀设置不同的配置文件,**PREFIX**与配置文件对应关系如下:
CORE_CONF: /srv/conf/hadoop/core-site.xmlHDFS_CONF: /srv/conf/hadoop/hdfs-site.xmlYARN_CONF : /srv/conf/hadoop/yarn-site.xmlHTTPFS_CONF : /srv/conf/hadoop/httpfs-site.xmlKMS_CONF : /srv/conf/hadoop/kms-site.xmlMAPRED_CONF : /srv/conf/hadoop/mapred-site.xml容器的环境变量可通过两种方式设置:
hadoop.env-e参数指定各个变量(不适合大量变量的设置)PROPETY:
在设置环境变量时,对特殊字符需要进行转义;使用 docker 或 docker-compose 启动容器时,环境变量与设置的属性转义规则如下:
_ ==> . : 环境变量中的下划线会被转义为设置属性中的半角点__ ==> _ : 环境变量中的双下划线会被转义为设置属性中的单下划线___ ==> - : 环境变量中的三下划线会被转义为设置属性中的中划线例如如下的环境变量及对应设置的实际属性为:
CORE_CONF_fs_defaultFS=hdfs://namenode:8020 :设置配置文件core-site.xml中fs.defaultFS属性,设置后类似如下:
xml<property><name>fs.defaultFS</name><value>hdfs://namenode:8020</value></property>
YARN_CONF_yarn_log___aggregation___enable=true :设置配置文件yarn-site.xml中yarn.log-aggregation-enable属性,设置后类似如下:
xml<property><name>yarn.log-aggregation-enable</name><value>true</value></property>
以下配置参数,如果设置,将批量设置对应的配置属性:
MULTIHOMED_NETWORK默认值:1。配置 Hadoop 集群在使用不同的网络时,可以正常访问;设置的配置文件及对应属性如下:
配置文件 /srv/conf/hadoop/hdfs-site.xml:
配置文件 /srv/conf/hadoop/yarn-site.xml:
配置文件 /srv/conf/hadoop/mapred-site.xml:
GANGLIA_HOST默认值:无。配置 Hadoop 将对应的度量数据发送至指定的 ganglia gmond 守护服务。
如果没有必要,可选配置参数可以不用定义,直接使用对应的默认值,主要包括:
ENV_DEBUG默认值:false。设置是否输出容器调试信息。可设置为:1、true、yes
本容器默认使用应用对应的运行时用户及用户组运行应用,以加强容器的安全性。在使用非root用户运行容器时,相关的资源访问会受限;应用仅能操作镜像创建时指定的路径及数据。使用Non-root方式的容器,更适合在生产环境中使用。




manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务