向队列填充记录,供https://github.com/Senzing/stream-loader%E6%B6%88%E8%B4%B9%E3%80%82
stream-producer.py Python脚本可读取不同格式的文件(JSON、CSV、Parquet、Avro)并将其发布到队列(RabbitMQ、Kafka、AWS SQS)。senzing/stream-producer Docker镜像作为封装,用于Docker部署形式(如docker-compose、kubernetes)。
要查看所有子命令,请运行:
console$ ./stream-producer.py --help usage: stream-producer.py [-h] {avro-to-kafka,avro-to-rabbitmq,avro-to-sqs,avro-to-sqs-batch,avro-to-stdout,csv-to-kafka,csv-to-rabbitmq,csv-to-sqs,csv-to-sqs-batch,csv-to-stdout,gzipped-json-to-kafka,gzipped-json-to-rabbitmq,gzipped-json-to-sqs,gzipped-json-to-sqs-batch,gzipped-json-to-stdout,json-to-kafka,json-to-rabbitmq,json-to-sqs,json-to-sqs-batch,json-to-stdout,parquet-to-kafka,parquet-to-rabbitmq,parquet-to-sqs,parquet-to-sqs-batch,parquet-to-stdout,websocket-to-kafka,websocket-to-rabbitmq,websocket-to-sqs,websocket-to-sqs-batch,websocket-to-stdout,sleep,version,docker-acceptance-test} ... 队列消息工具。更多信息,请参见 https://github.com/Senzing/stream-producer 位置参数: {avro-to-kafka,avro-to-rabbitmq,avro-to-sqs,avro-to-sqs-batch,avro-to-stdout,csv-to-kafka,csv-to-rabbitmq,csv-to-sqs,csv-to-sqs-batch,csv-to-stdout,gzipped-json-to-kafka,gzipped-json-to-rabbitmq,gzipped-json-to-sqs,gzipped-json-to-sqs-batch,gzipped-json-to-stdout,json-to-kafka,json-to-rabbitmq,json-to-sqs,json-to-sqs-batch,json-to-stdout,parquet-to-kafka,parquet-to-rabbitmq,parquet-to-sqs,parquet-to-sqs-batch,parquet-to-stdout,websocket-to-kafka,websocket-to-rabbitmq,websocket-to-sqs,websocket-to-sqs-batch,websocket-to-stdout,sleep,version,docker-acceptance-test} 子命令(SENZING_SUBCOMMAND): avro-to-kafka 读取Avro文件并发送到Kafka avro-to-rabbitmq 读取Avro文件并发送到RabbitMQ avro-to-sqs 读取Avro文件并发送到AWS SQS avro-to-stdout 读取Avro文件并输出到STDOUT csv-to-kafka 读取CSV文件并发送到Kafka csv-to-rabbitmq 读取CSV文件并发送到RabbitMQ csv-to-sqs 读取CSV文件并发送到SQS csv-to-stdout 读取CSV文件并输出到STDOUT gzipped-json-to-kafka 读取gzip压缩的JSON文件并发送到Kafka gzipped-json-to-rabbitmq 读取gzip压缩的JSON文件并发送到RabbitMQ gzipped-json-to-sqs 读取gzip压缩的JSON文件并发送到AWS SQS gzipped-json-to-stdout 读取gzip压缩的JSON文件并输出到STDOUT json-to-kafka 读取JSON文件并发送到Kafka json-to-rabbitmq 读取JSON文件并发送到RabbitMQ json-to-sqs 读取JSON文件并发送到AWS SQS json-to-stdout 读取JSON文件并输出到STDOUT parquet-to-kafka 读取Parquet文件并发送到Kafka parquet-to-rabbitmq 读取Parquet文件并发送到RabbitMQ parquet-to-sqs 读取Parquet文件并发送到AWS SQS parquet-to-stdout 读取Parquet文件并输出到STDOUT sleep 仅休眠,用于Docker测试 version 打印程序版本 docker-acceptance-test 用于Docker验收测试 可选参数: -h, --help 显示此帮助消息并退出
在Senzing,我们致力于以“https://github.com/Senzing/knowledge-base/blob/main/WHATIS/dont-make-me-think.md%E2%80%9D%E7%9A%84%E9%A3%8E%E6%A0%BC%E5%88%9B%E5%BB%BAGitHub%E6%96%87%E6%A1%A3%E3%80%82%E5%A4%A7%E5%A4%9A%E6%95%B0%E6%83%85%E5%86%B5%E4%B8%8B%EF%BC%8C%E6%8C%87%E4%BB%A4%E6%98%AF%E5%A4%8D%E5%88%B6%E7%B2%98%E8%B4%B4%E5%8D%B3%E5%8F%AF%E6%89%A7%E8%A1%8C%E7%9A%84%E3%80%82%E5%BD%93%E9%9C%80%E8%A6%81%E9%A2%9D%E5%A4%96%E6%80%9D%E8%80%83%E6%97%B6%EF%BC%8C%E4%BC%9A%E6%A0%87%E8%AE%B0%E4%B8%BA%E2%80%9C%E6%80%9D%E8%80%83%E2%80%9D%E5%9B%BE%E6%A0%87 :thinking:。当需要自定义时,会标记为“铅笔”图标 :pencil2:。如果指令不清晰,请通过创建新的https://github.com/Senzing/template-python/issues/new?template=documentation_request.md%E5%91%8A%E8%AF%89%E6%88%91%E4%BB%AC%E9%9C%80%E8%A6%81%E6%94%B9%E8%BF%9B%E7%9A%84%E5%9C%B0%E6%96%B9%E3%80%82%E7%8E%B0%E5%9C%A8%E5%BC%80%E5%A7%8B%E6%BC%94%E7%A4%BA...
运行Docker容器。以下命令将显示帮助信息。示例:
consoledocker run \ --rm \ senzing/stream-producer --help
更多使用示例,请参见Docker示例。
部署Stream Loader所需的https://github.com/Senzing/knowledge-base/blob/main/HOWTO/deploy-rabbitmq-postgresql-backing-services.md#using-docker-compose%E3%80%82
指定放置工件的目录。示例:
consoleexport SENZING_VOLUME=~/my-senzing mkdir -p ${SENZING_VOLUME}
下载docker-compose.yaml文件。示例:
consolecurl -X GET \ --output ${SENZING_VOLUME}/docker-compose.yaml \ https://raw.githubusercontent.com/Senzing/stream-producer/main/docker-compose.yaml
启动docker-compose栈。示例:
consoledocker-compose -f ${SENZING_VOLUME}/docker-compose.yaml up
:thinking: 继续之前需要完成以下任务。这些是“一次性任务”,可能已经完成。
安装Python依赖项。示例:
consolepip3 install -r https://raw.githubusercontent.com/Senzing/stream-producer/main/requirements.txt
获取stream-producer.py的本地副本。示例:
:pencil2: 指定下载文件的位置。示例:
consoleexport SENZING_DOWNLOAD_FILE=~/stream-producer.py
下载文件。示例:
consolecurl -X GET \ --output ${SENZING_DOWNLOAD_FILE} \ https://raw.githubusercontent.com/Senzing/stream-producer/main/stream-producer.py
使文件可执行。示例:
consolechmod +x ${SENZING_DOWNLOAD_FILE}
:thinking: 替代方案:可通过克隆仓库中的说明下载整个git仓库。
运行命令。示例:
console${SENZING_DOWNLOAD_FILE} --help
更多使用示例,请参见CLI示例。
通过环境变量或命令行参数指定配置值。
stream-producer.py使用AWS SDK for Python (Boto3)访问AWS服务。可通过环境变量或~/.aws/config文件配置此库。
用于配置的环境变量示例:
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。


探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务