轩辕镜像 官方专业版
轩辕镜像
专业版
轩辕镜像 官方专业版
轩辕镜像
专业版
首页个人中心搜索镜像
交易
充值流量¥7起我的订单
文档
工具
提交工单页面收录
connect-base

debezium/connect-base

debezium
自动构建

不带预定义连接器的Kafka Connect基础镜像

10 次收藏下载次数: 0状态:自动构建维护者:debezium仓库类型:镜像最近更新:1 年前
让 AI 帮你使用轩辕镜像? · 展开查看说明 · 点击收起说明

如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。

只需在 AI 对话中先发送下面这句话即可:

请先完整阅读并严格遵守以下文档中的全部规则与要求:

https://xuanyuan.cloud/agents.md

在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。

查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。

中文简介
下载命令
镜像标签列表与下载命令
轩辕镜像,加速的不只是镜像。
点击查看

Debezium Connect Base 镜像文档

镜像概述

本仓库已迁移至 quay.io/debezium/connect-base。

Kafka Connect 是用于在Kafka中移入和移出数据的系统。所有Debezium连接器均遵循Kafka Connector API的源连接器规范,每个连接器监控特定类型的数据库管理系统的变更数据,并将这些变更转发到按服务器、数据库和表组织的Kafka主题中。本镜像定义了一个可运行的Kafka Connect服务,预配置了所有Debezium连接器。该服务提供RESTful API用于管理连接器实例——只需启动容器,为每个要监控的数据源配置连接器,Debezium就会监控这些源的变更并将其转发到相应的Kafka主题。

什么是Debezium?

Debezium是一个分布式平台,可将现有数据库转换为事件流,使应用程序能够快速响应数据库中的每个行级变更。Debezium构建在Kafka之上,提供与Kafka Connect兼容的连接器,用于监控特定的数据库管理系统。Debezium将数据变更历史记录在Kafka日志中,因此应用程序可以随时停止和重启,并轻松消费其未运行期间错过的所有事件,确保所有事件都能被正确且完整地处理。

运行Debezium需要Zookeeper、Kafka以及运行Debezium连接器的服务。对于简单的评估和实验,所有服务都可以在单台主机上运行,如下文所述。然而,生产环境需要正确运行和联网多个服务实例,以提供性能、可靠性、复制和容错能力。这可以通过OpenShift等平台实现,该平台管理在多台主机和机器上运行的多个Docker容器。但在Docker容器中运行Kafka存在局限性,因此对于需要极高吞吐量的场景,应按照Kafka文档的说明在专用硬件上运行Kafka。

如何使用此镜像

本镜像作为其他希望使用自定义Kafka Connect连接器的镜像的基础镜像。它提供了完整的Kafka及其Kafka Connect库安装,以及docker-entrypoint.sh脚本,该脚本将运行Kafka Connect分布式服务,并动态设置Java类路径以包含$KAFKA_CONNECT_PLUGINS_DIR(即/kafka/connect)下子目录中的连接器JAR文件。

要添加连接器,您的镜像应基于此镜像(例如,使用FROM debezium/connect-base),并将一个或多个连接器的JAR文件添加到$KAFKA_CONNECT_PLUGINS_DIR下的一个或多个子目录中。

一般建议为每个连接器创建一个单独的子目录(例如"debezium-connector-mysql"),并将该连接器的JAR文件和其他资源文件放在该子目录中。

但是,当连接器共享依赖项时,应使用单个目录。这将防止共享依赖项中的类出现在类路径上的多个JAR中,从而避免出现难以理解的NoSuchMethodError异常。

启动Kafka Connect服务实例

注意:有关运行Kafka Connect的一般信息以及各种选项和环境变量的更多详细信息,请参阅Apache Kafka 文档。

Kafka Connect需要已运行的Zookeeper服务,该服务要么通过名为zookeeper的容器在本地运行,要么通过OpenShift作为名为zookeeper的服务运行。还需要已运行的Kafka代理,该代理要么通过名为kafka的容器在本地运行,要么通过OpenShift作为名为kafka的服务运行。

当运行一个或多个Kafka Connect服务实例的集群时,必须使用环境变量定义几个重要参数。请参见下文了解这些必需环境变量的列表和可接受的值。

使用此镜像启动Kafka Connect实例非常简单:

bash
$ docker run -it --name connect -p 8083:8083 -e GROUP_ID=1 -e CONFIG_STORAGE_TOPIC=my-connect-configs -e OFFSET_STORAGE_TOPIC=my-connect-offsets -e STATUS_STORAGE_TOPIC=my-connect-statuses -e ADVERTISED_HOST_NAME=$(echo $DOCKER_HOST | cut -f3  -d'/' | cut -f1 -d':') --link zookeeper:zookeeper --link kafka:kafka debezium/connect

此命令使用此镜像并启动一个名为connect的新容器,该容器在前台运行并附加控制台,以显示服务的输出和错误消息。它在8083端口上公开其REST API,该端口映射到本地主机上的相同端口号。它使用名为zookeeper的容器(或服务)中的Zookeeper和名为kafka的容器(或服务)中的Kafka代理。此命令设置了三个必需的环境变量,但您应将其值替换为适合您环境的更有意义的值。

要以分离模式启动容器,只需将-it选项替换为-d。服务输出不会发送到您的控制台,但可以随时使用docker logs命令读取。例如,以下命令将显示输出并持续跟踪输出:

bash
$ docker logs --follow --name connect

在运行的容器中启动shell

如果您已经在运行带有Kafka Connect服务的容器,可以使用此镜像连接到该容器并获取命令行shell:

bash
$ docker exec -it connect bash

其中connect是现有容器的名称。shell将设置所有环境变量,与在容器中启动服务时完全相同。因此,可以指定到其他容器的链接和其他环境变量,这些都将反映在shell的导出变量中。

环境变量

Debezium Kafka镜像在使用此镜像运行Kafka代理时使用多个环境变量。

GROUP_ID

运行Kafka Connect服务时需要此环境变量。将其设置为唯一标识服务及其工作节点所属的Kafka Connect集群的ID。

CONFIG_STORAGE_TOPIC

运行Kafka Connect服务时需要此环境变量。将其设置为Kafka Connect服务在组中存储连接器配置的Kafka主题名称。该主题必须有单个分区,应高度复制(例如3倍或更多),并应配置为压缩。

OFFSET_STORAGE_TOPIC

运行Kafka Connect服务时需要此环境变量。将其设置为Kafka Connect服务在组中存储连接器偏移量的Kafka主题名称。该主题应具有多个分区,高度复制(例如3倍或更多),并应配置为压缩。

STATUS_STORAGE_TOPIC

运行Kafka Connect服务时应提供此环境变量。将其设置为Kafka Connect服务在组中存储连接器状态的Kafka主题名称。该主题可以有多个分区,应高度复制(例如3倍或更多),并应配置为压缩。

BOOTSTRAP_SERVERS

此环境变量是高级设置,仅在Kafka未在可链接的容器或服务中运行时使用。将其设置为用于建立与Kafka集群的初始连接的主机/端口对列表。一旦与这些代理之一建立连接,服务将发现并使用Kafka集群中的所有Kafka代理,无论此处为引导指定了哪些服务器。列表的格式应为host1:port1,host2:port2,...。建议在此列表中包含多个代理,以防其中一个不可用。

REST_HOST_NAME

此环境变量是高级设置。将其设置为REST API将绑定的主机名。默认为容器的主机名。指定值0.0.0.0可将REST API绑定到所有可用接口。

ADVERTISED_HOST_NAME

此环境变量是高级设置。将其设置为将提供给其他工作节点连接的主机名。默认为容器的主机名。

KEY_CONVERTER

此环境变量是高级设置。将其设置为实现Kafka Connect的Converter类的Java类的完全限定名称,用于将连接器的键转换为存储在Kafka中的形式。默认为org.apache.kafka.connect.json.JsonConverter。

VALUE_CONVERTER

此环境变量是高级设置。将其设置为实现Kafka Connect的Converter类的Java类的完全限定名称,用于将连接器的值转换为存储在Kafka中的形式。默认为org.apache.kafka.connect.json.JsonConverter。

INTERNAL_KEY_CONVERTER

此环境变量是高级设置。将其设置为实现Kafka Connect的Converter类的Java类的完全限定名称,用于将连接器偏移量和配置键转换为存储在Kafka中的形式。默认为org.apache.kafka.connect.json.JsonConverter。

INTERNAL_VALUE_CONVERTER

此环境变量是高级设置。将其设置为实现Kafka Connect的Converter类的Java类的完全限定名称,用于将连接器偏移量和配置值转换为存储在Kafka中的形式。默认为org.apache.kafka.connect.json.JsonConverter。

OFFSET_FLUSH_INTERVAL_MS

此环境变量是高级设置。将其设置为服务定期尝试提交任务偏移量的时间间隔(以毫秒为单位)。默认值为60000(即60秒)。

OFFSET_FLUSH_TIMEOUT_MS

此环境变量是高级设置。将其设置为等待记录刷新和分区偏移量数据提交到偏移量存储的最大时间(以毫秒为单位),超时后将取消该过程并在未来尝试中恢复要提交的偏移量数据。默认值为5000(即5秒)。

SHUTDOWN_TIMEOUT

此环境变量是高级设置。将其设置为等待任务优雅关闭的时间(以毫秒为单位),同时连接器完成所有处理、记录任何最终数据并清理资源。这是总时间,不是每个任务的时间。所有任务都会触发关闭,然后按顺序等待它们。默认值为10000(即10秒)。

HEAP_OPTS

此环境变量是推荐的。使用此设置Kafka代理的JVM选项。默认值为-Xmx1G -Xms1G,意味着每个Kafka代理使用1GB内存。内存过少可能导致性能问题,过多可能导致代理无法在机器可用内存下正常启动。显然,容器必须能够使用此环境变量定义的内存量。

CONNECT_LOG4J_LOGGERS

此环境变量是可选的。使用此覆盖log4j.properties中用于log4j.rootLogger属性的日志记录器。可以提供带有CONNECT_LOG4J前缀的其他环境变量,如下面“其他”部分所述映射到log4j.properties文件中的属性。

LOG_LEVEL

此环境变量是可选的。使用此设置Kafka应用程序日志写入STDOUT和STDERR的详细级别。有效值为INFO(默认)、WARN、ERROR、DEBUG或TRACE。

ENABLE_APICURIO_CONVERTERS

此环境变量是可选的。通过将ENABLE_APICURIO_CONVERTERS=true设置为容器环境变量,可使用Apicurio Schema Registry启用Apicur.io转换器。有效值为false(禁用,默认)或true(启用Apicurio转换器)。

ENABLE_DEBEZIUM_SCRIPTING

此环境变量是可选的。通过将ENABLE_DEBEZIUM_SCRIPTING=true设置为容器环境变量,可启用使用脚本语言的Debezium功能,如消息过滤或基于内容的路由SMT。有效值为false(禁用,默认)或true(启用脚本)。注意:为防止执行任意脚本表达式,仅当您已适当保护对Kafka Connect配置界面的访问时,才应启用此选项。

ENABLE_JFR

此环境变量是可选的。设置后,将为此运行启动Flight Recorder记录会话。此功能对于在出现性能或功能问题时收集诊断信息非常有用。当变量转换为小写并将下划线替换为连字符时,可以通过JFR_RECORDING_前缀的环境变量配置Flight Recorder启动选项,例如JFR_RECORDING_PATH_TO_GC_ROOTS=true变为path-to-gc-roots=true。可以通过JFR_OPT_前缀的环境变量配置Flight Recorder控制选项。

其他

以CONNECT_开头的环境变量将用于更新Kafka Connect工作节点配置文件。每个环境变量名称将通过以下方式映射到配置属性名称:

  1. 移除CONNECT_前缀;
  2. 将所有字符转换为小写;
  3. 将所有'_'字符转换为'.'字符

例如,环境变量CONNECT_HEARTBEAT_INTERVAL_MS转换为heartbeat.interval.ms属性。容器随后将更新Kafka Connect工作节点配置文件以包含该属性的名称和值。

环境变量的值不能包含'@'字符。

端口

使用此镜像创建的容器将公开8083端口,这是Kafka Connect服务绑定的标准端口。您可以使用标准Docker选项将其映射到运行容器的主机上的不同端口。

存储数据

此镜像运行的Kafka Connect服务不在容器中存储数据,但会生成日志。保留这些文件的唯一方法是使用卷将容器内的特定目录映射到本地文件系统(或OpenShift持久卷)。

日志文件

尽管此镜像会将Kafka Connect服务日志输出发送到标准输出,以便作为Docker日志可见,但此镜像还将Kafka Connect服务配置为将更多日志写入/kafka/logs的数据卷。所有日志每天轮换。

配置

此镜像在/kafka/config定义了一个数据卷,其中存储代理的配置文件。请注意,这些配置文件始终基于环境变量和链接的容器进行修改。此数据卷的最佳用途是能够查看Kafka使用的配置文件,尽管通过一些注意事项,也可以提供在启动时将被调整和使用的自定义配置文件。

镜像拉取方式

您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。

轩辕镜像加速拉取命令点我查看更多 connect-base 镜像标签

docker pull docker.xuanyuan.run/debezium/connect-base:<标签>

使用方法:

  • 登录认证方式
  • 免认证方式

DockerHub 原生拉取命令

docker pull debezium/connect-base:<标签>

轩辕镜像配置手册

按平台快速找到配置文档

Docker

登录仓库拉取

登录认证 · 私有仓库

专属域名拉取

免登录 · 高速拉取

Linux

Docker 镜像配置

Windows / Mac

Docker Desktop 配置

MacOS OrbStack

OrbStack 容器

Docker Compose

Compose 项目配置

NAS

群晖

Synology 配置

飞牛

fnOS 镜像配置

绿联

绿联 NAS

威联通

QNAP 配置

极空间

极空间 NAS

企业仓库

其他仓库

ghcr · Quay · nvcr

Harbor 镜像源

Proxy Repository 对接

Portainer 镜像源

Registries 配置

Nexus 镜像源

Docker Proxy 缓存

开发工具

Dev Containers

VS Code 开发容器

Podman

Podman 配置指南

Singularity / Apptainer

HPC 科学计算容器

Kubernetes

K8s Containerd

Kubernetes · Containerd

K3s

轻量级集群

面板 / 网络

爱快路由

iKuai 镜像加速

宝塔面板

一键配置镜像源

AI

用 AI 使用轩辕镜像

agents.md · AI 对话 · 提示词

一键安装

一键安装 Docker

Linux Docker 一键安装

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

功能

免费版与专业版区别

功能对比 · 版本选择

支持的镜像仓库

Docker Hub · GCR · GHCR

新手拉取配置

登录 · 专属域名 · 配置

docker search 限制

专属域名 · Hub 搜索

不支持 push

仅支持 pull · 不支持

拉取速度原因

带宽 · 缓存 · 冷热镜像

错误码

402 与流量用尽

402 · 流量包 · 充值

401 认证失败

401 · docker login

manifest unknown

标签错误 · 镜像不存在

410 Gone 排查

410 · Docker 升级

429 限流

免费版 · 请求频率

其他报错

DNS 超时

DNS 解析 · 网络超时

TLS 证书失败

no matching manifest(架构)

账号

失败是否计费

manifest · blob · 计费

申请开发票(企业 / 个人)

企业 · 个人 · 工单

修改登录密码

网站 · 仓库 · 重置

注销账户

工单 · 数据 · 注销

原理

mirrors 不生效

daemon.json · 重启

去掉域名前缀

docker tag · 重命名

指定架构拉取

ARM64 · AMD64 · 多架构

latest 与「最新」

digest · 版本号 · 标签

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
镜像详情
...
debezium/connect-base
教程轩辕镜像功能与使用教程
定价查看流量套餐与价格
热门查看热门 Docker 镜像推荐
博客Docker 镜像公告与技术博客
专业版 · 高速稳定拉取镜像
高速镜像下载·在线技术支持·99.95% SLA 保障·付费会员免广告
50GB 仅 ¥7/年
专业版 · 高速稳定拉取镜像
50GB 仅 ¥7/年
高速镜像下载·在线技术支持·99.95% SLA 保障·付费会员免广告
商务合作:点击复制邮箱
用户协议·隐私政策·©2024-2026 源码跳动
用户协议·隐私政策©2024-2026 杭州源码跳动科技有限公司商务合作:点击复制邮箱

更多 connect-base 镜像推荐

careport/connect-base logo

careport/connect-base

careport
暂无描述
10万+ 次下载
4 个月前更新
stellanetops/connect-base logo

stellanetops/connect-base

stellanetops
暂无描述
1万+ 次下载
8 年前更新
stellaservice/connect-base logo

stellaservice/connect-base

stellaservice
StellaConnect Rails应用及工作进程的基础镜像,用于支持StellaService内部PCM、Connect API等应用的构建与部署流程,通过Fabric工具简化任务管理。
1万+ 次下载
8 年前更新
r-base logo

library/r-base

Docker 官方镜像
R是一款开源的统计计算与图形绘制系统,具备强大的数据处理、分析、建模及可视化功能,拥有丰富的扩展包生态与活跃的全球社区支持,广泛应用于学术研究、数据分析、机器学习等领域,为用户提供从数据清洗到结果呈现的全流程解决方案。
561 次收藏1000万+ 次下载
1 个月前更新
cimg/base logo

cimg/base

cimg
CircleCI基础便捷镜像,基于Ubuntu系统,为CI/CD流程提供稳定高效的构建环境支持。
27 次收藏1亿+ 次下载
23 天前更新

查看更多 connect-base 相关镜像