
johannestang/hive本镜像提供一个以伪分布式模式运行的大数据技术栈,集成了多个核心大数据组件,旨在为开发、测试和学习环境提供完整的大数据处理能力。通过该镜像,用户可以快速部署包含分布式存储、数据仓库、SQL查询引擎和数据可视化工具的完整大数据环境。
克隆仓库并基于sample.env创建.env文件,确保DATADIR指向合适的目录(用于所有容器的持久化存储)
启动基础栈:
bashdocker-compose up -d
bashdocker-compose -f superset/docker-compose.yml up -d docker-compose -f hue/docker-compose.yml up -d
bash./scripts/init-hue.sh ./scripts/init-superset.sh
启动后,以下服务可用:
所有必要镜像已发布到Docker Hub,如需自行构建更新/修改的镜像,可在各子目录中运行build-local.sh脚本。
scripts目录包含以下辅助脚本:
beeline.sh: 在Hive容器中启动Beeline(Hive CLI)hadoop-client.sh: 启动包含Hadoop工具的容器(主机文件系统挂载为/host),用于将文件移动到HDFSinit-hue.sh: 在HDFS中创建管理员主目录,避免Hue文件浏览器出错init-superset.sh: 初始化Superset数据库并添加Presto作为数据源presto-cli.sh: 启动Presto CLI(必要时自动下载jar包)详见以下文章:大数据栈:运行SQL查询




manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务