StreamSets Data Collector是一款数据收集和处理工具,本Docker镜像基于Alpine Linux构建,提供便捷的部署和运行方式,适用于各类数据收集场景,支持自定义配置、数据持久化及扩展功能。
适用于需要快速部署数据收集和处理工具的场景,包括但不限于:
启动容器
bashdocker run --restart on-failure -p 18630:18630 -d --name sdc streamsets/datacollector
登录方式
localhost:18630(或替换为容器运行主机的IP)accounts.streamsets.com 账户登录(可免费注册)默认用户名/密码:bashdocker run --restart on-failure -p 18630:18630 -d --name sdc --env SDC_CONF_http_authentication=form streamsets/datacollector
admin/admin注意事项
accounts.streamsets.com 激活产品support.streamsets.com 获取更多激活步骤/etc/sdc 或 /etc/sdc/<特定配置文件>SDC_CONF_ 的环境变量覆盖 sdc.properties 中的配置,例如:
http.port 对应环境变量 SDC_CONF_HTTP_PORT=12345/data(可通过环境变量 SDC_DATA 修改)streamsets 命令示例:自定义配置和数据卷
bashdocker run -v $PWD/sdc.properties:/etc/sdc/sdc.properties:ro -v $PWD/sdc-data:/data:rw -p 18630:18630 -d streamsets/datacollector dc
基本数据卷创建
bashdocker volume create --name sdc-data
使用数据卷启动容器
bashdocker run -v sdc-data:/data -P -d streamsets/datacollector dc
说明:Docker 数据管理有两种方式:数据卷(创建时为空)和数据容器(基于镜像派生,包含初始文件)。详情参考 Docker 数据卷文档。
选项 1:使用数据卷(推荐)
创建配置数据容器
bashdocker create -v /etc/sdc --name sdc-conf streamsets/datacollector
编辑配置文件
通过临时容器编辑配置:
bashdocker run --rm -it --volumes-from sdc-conf ubuntu bash
(可替换 ubuntu 为其他基础镜像,在 /etc/sdc 目录下修改配置文件)
创建多数据卷容器
bashdocker create -v /etc/sdc -v /data --name sdc-volumes streamsets/datacollector
管理阶段库
创建阶段库数据卷:
bashdocker volume create --name sdc-stagelibs # 如未创建 /data 数据卷,需同时创建 docker volume create --name sdc-data
挂载阶段库和数据卷启动容器(以 3.9.1 版本为例):
bashdocker run --name sdc -d -v sdc-stagelibs:/opt/streamsets-datacollector-3.9.1/streamsets-libs -v sdc-data:/data -P streamsets/datacollector dc -verbose
列出可用阶段库:
bashdocker run --rm streamsets/datacollector:3.9.1 stagelibs -list
安装阶段库(如 JDBC):
bashdocker run --rm -v sdc-stagelibs:/opt/streamsets-datacollector-3.9.1/streamsets-libs streamsets/datacollector:3.9.1 stagelibs -install=streamsets-datacollector-jdbc-lib
选项 2:构建自定义镜像
通过 Dockerfile 基于官方镜像创建自定义镜像,便于分发:
示例 Dockerfile
dockerfileFROM streamsets/datacollector:3.9.1 # 自定义 sdc.properties 配置 COPY sdc.properties /etc/sdc/sdc.properties
构建和推送镜像
bashdocker build -t mycompany/datacollector:3.9.1-abc . docker push mycompany/datacollector:3.9.1-abc
注意:不推荐通过
docker commit命令基于运行中容器创建镜像。
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务