轩辕镜像
轩辕镜像专业版
个人中心搜索镜像
交易
充值流量我的订单
工具
工单支持镜像收录Run 助手IP 归属地密码生成Npm 源Pip 源
帮助
常见问题我要吐槽
其他
关于我们网站地图

官方QQ群: 13763429

轩辕镜像
镜像详情
abcfy2/zhparser
官方博客使用教程热门镜像工单支持
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。
所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。
轩辕镜像 - 国内开发者首选的专业 Docker 镜像下载加速服务平台 - 官方QQ群:13763429 👈点击免费获得技术支持。
本站面向开发者与科研用户,提供开源镜像的搜索和下载加速服务。所有镜像均来源于原始开源仓库,本站不存储、不修改、不传播任何镜像内容。

本站支持搜索的镜像仓库:Docker Hub、gcr.io、ghcr.io、quay.io、k8s.gcr.io、registry.gcr.io、elastic.co、mcr.microsoft.com

zhparser Docker 镜像下载 - 轩辕镜像

zhparser 镜像详细信息和使用指南

zhparser 镜像标签列表和版本信息

zhparser 镜像拉取命令和加速下载

zhparser 镜像使用说明和配置指南

Docker 镜像加速服务 - 轩辕镜像平台

国内开发者首选的 Docker 镜像加速平台

极速拉取 Docker 镜像服务

相关 Docker 镜像推荐

热门 Docker 镜像下载

zhparser
abcfy2/zhparser

zhparser 镜像详细信息

zhparser 镜像标签列表

zhparser 镜像使用说明

zhparser 镜像拉取命令

Docker 镜像加速服务

轩辕镜像平台优势

镜像下载指南

相关 Docker 镜像推荐

基于zhparser的PostgreSQL中文全文搜索Docker镜像,支持中文分词与全文检索,基于PostgreSQL官方镜像构建,提供多版本及Alpine基础镜像支持。
11 收藏0 次下载activeabcfy2镜像
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源
中文简介版本下载
🚀轩辕镜像专业版更稳定💎一键安装 Docker 配置镜像源

zhparser 镜像详细说明

zhparser 使用指南

zhparser 配置说明

zhparser 官方文档

zhparser PostgreSQL中文全文搜索镜像

镜像概述

基于zhparser的PostgreSQL中文全文搜索Docker镜像,用于实现PostgreSQL数据库的中文分词与全文检索功能。本镜像从chen-xin/docker_zhparser fork而来,并已升级至新版本。

镜像仓库

  • Docker Hub
  • GitHub Container Registry
  • Quay.io

支持的标签及对应Dockerfile链接

标签Dockerfile链接
latestDockerfile.debian
17Dockerfile.debian
16Dockerfile.debian
15Dockerfile.debian
14Dockerfile.debian
13Dockerfile.debian
alpineDockerfile.alpine
17-alpineDockerfile.alpine
16-alpineDockerfile.alpine
15-alpineDockerfile.alpine
14-alpineDockerfile.alpine
13-alpineDockerfile.alpine

注:标签中的数字对应PostgreSQL官方镜像版本。

核心功能与特性

  • 集成zhparser扩展:基于Xunsearch的SCWS(Simple Chinese Word Segmentation)分词引擎,实现中文分词
  • 全文检索配置:支持自定义文本搜索配置,映射分词类型(n、v、a等)
  • 多版本支持:覆盖PostgreSQL 13至17版本,提供Debian和Alpine两种基础镜像
  • 自定义词典:支持添加TXT格式或XDB格式的自定义词典,优化分词效果
  • 索引支持:可基于中文全文搜索配置创建GIN索引,提升查询性能

使用场景

适用于需要在PostgreSQL中实现中文全文检索的场景,如:

  • 内容管理系统(CMS)的文章检索
  • 文档管理平台的中文文档搜索
  • 博客、论坛的帖子内容检索
  • 企业内部知识库的中文信息查询

使用方法

基本运行命令

参考PostgreSQL官方镜像文档,基础运行命令如下:

docker run -p 5432:5432 abcfy2/zhparser

首次配置(默认数据库)

容器首次启动时,需在默认数据库中执行以下SQL脚本配置zhparser。对于新创建的数据库,需手动执行相同脚本:

-- 创建zhparser扩展
CREATE EXTENSION zhparser;

-- 创建文本搜索配置(名称可自定义,如"chinese_zh")
CREATE TEXT SEARCH CONFIGURATION chinese_zh (PARSER = zhparser);

-- 添加分词类型映射(n:名词, v:动词, a:形容词等)
ALTER TEXT SEARCH CONFIGURATION chinese_zh ADD MAPPING FOR n,v,a,i,e,l WITH simple;

配置说明:

  • "chinese_zh"为自定义配置名称,可按需修改
  • "n,v,a,i,e,l"为分词类型,未映射的类型将不参与文档分词。使用\dFp+ zhparser可查看zhparser支持的所有分词类型

功能测试

1. 分词调试(ts_debug)

select ts_debug('chinese_zh', '白垩纪是地球上海陆分布和生物界急剧变化、火山活动频繁的时代');

输出示例:

ts_debug
-------------------------------------------
(t,time,白垩纪,{},,)
(v,verb,是,{simple},simple,{是})
(n,noun,地球,{simple},simple,{地球})
(n,noun,上海,{simple},simple,{上海})
(m,numeral,陆,{},,)
(v,verb,分布,{simple},simple,{分布})
(c,conjunction,和,{},,)
(n,noun,生物界,{simple},simple,{生物界})
(d,adverb,急剧,{},,)
(v,verb,变化,{simple},simple,{变化})
(u,auxiliary,、,{},,)
(n,noun,火山,{simple},simple,{火山})
(v,verb,活动,{simple},simple,{活动})
(a,adjective,频繁,{simple},simple,{频繁})
(u,auxiliary,的,{},,)
(n,noun,时代,{simple},simple,{时代})
(16 rows)

2. 文本向量转换(to_tsvector)

select to_tsvector('chinese_zh', '白垩纪是地球上海陆分布和生物界急剧变化、火山活动频繁的时代');

输出示例:

to_tsvector
--------------------------------------------------------------------------------------------
'上海':3 '分布':4 '变化':6 '地球':2 '时代':10 '是':1 '活动':8 '火山':7 '生物界':5 '频繁':9
(1 row)

注:若需包含"白垩纪",需添加t类型映射:ALTER TEXT SEARCH CONFIGURATION chinese_zh ADD MAPPING FOR t WITH simple;

3. 查询匹配(to_tsquery & @@)

-- 判断"地球"是否在文本中
select to_tsquery('chinese_zh', '地球') @@ to_tsvector('chinese_zh', '白垩纪是地球上海陆分布和生物界急剧变化、火山活动频繁的时代');

输出示例:

?column?
----------
t
(1 row)

在表中使用

创建表与索引

-- 创建测试表
create table testing(
  title text
);

-- 插入测试数据
insert into testing values('白垩纪是地球上海陆分布和生物界急剧变化、火山活动频繁的时代');
insert into testing values('艾泽拉斯包括卡利姆多、东部王国两大大陆,暗夜精灵主城达纳苏斯位于东部王国北端。');

-- 创建GIN索引(基于中文全文搜索配置)
create index ind_testing on testing using gin (to_tsvector('chinese_zh', title));

执行查询

-- 搜索包含"白垩纪"的记录
select * from testing where to_tsquery('chinese_zh', '白垩纪') @@ to_tsvector('chinese_zh', title);

-- 搜索包含"达纳苏斯"的记录
select * from testing where to_tsquery('chinese_zh', '达纳苏斯') @@ to_tsvector('chinese_zh', title);

注:若表数据量较少,PostgreSQL可能选择顺序扫描而非索引扫描。当数据量达到数万级时,GIN索引将显著提升查询性能。

添加自定义词典

1. TXT格式词典

  1. 在容器内创建词典文件(路径固定为/usr/share/postgresql/<version>/tsearch_data/,文件名可自定义,如mydict.utf8.txt):
# 格式:word TF IDF ATTR(TF/IDF为权重,ATTR为分词类型)
艾泽拉斯  1 1 n
卡利姆多  1 1 n
达纳苏斯  1 1 n
遗忘海岸  1 1 n
  1. 修改PostgreSQL配置文件postgresql.conf,添加词典路径:
zhparser.extra_dicts = 'mydict.utf8.txt'
  1. 重启容器,测试分词效果:
select ts_debug('chinese_zh', '艾泽拉斯');

输出示例:

(n,noun,艾泽拉斯,{simple},simple,{艾泽拉斯})

2. XDB格式词典(推荐)

XDB格式为二进制词典,性能优于TXT格式,步骤如下:

  1. 从TXT词典生成XDB文件:
# 进入词典目录
cd /usr/share/postgresql/<version>/tsearch_data/

# 生成XDB词典(需确保scws-gen-dict工具可用)
ldconfig  # 解决可能的库依赖问题
scws-gen-dict -c UTF8 mydict.utf8.txt mydict.utf8.xdb

# 修改文件权限(确保postgres用户可访问)
chown postgres:postgres mydict.utf8.xdb
  1. 更新配置文件,使用XDB词典:
sed -i 's/mydict\.utf8\.txt/mydict.utf8.xdb/' /var/lib/postgresql/data/postgresql.conf
  1. 重启容器,验证分词效果。

额外资源

  • zhparser GitHub仓库
  • SCWS分词引擎文档
  • 搜狗词库转换工具(scel2mmseg):可将搜狗拼音词库(.scel)转换为文本词典
查看更多 zhparser 相关镜像 →
mixdeve/postgres-zhparser logo
mixdeve/postgres-zhparser
by mixdeve
包含zhparser插件的PostgreSQL Docker镜像,支持中文全文搜索,预安装插件无需手动编译,开箱即用中文分词功能,适用于需要中文文本检索的PostgreSQL应用场景。
110K+ pulls
上次更新:23 小时前

常见问题

轩辕镜像免费版与专业版有什么区别?

免费版仅支持 Docker Hub 加速,不承诺可用性和速度;专业版支持更多镜像源,保证可用性和稳定速度,提供优先客服响应。

轩辕镜像免费版与专业版有分别支持哪些镜像?

免费版仅支持 docker.io;专业版支持 docker.io、gcr.io、ghcr.io、registry.k8s.io、nvcr.io、quay.io、mcr.microsoft.com、docker.elastic.co 等。

流量耗尽错误提示

当返回 402 Payment Required 错误时,表示流量已耗尽,需要充值流量包以恢复服务。

410 错误问题

通常由 Docker 版本过低导致,需要升级到 20.x 或更高版本以支持 V2 协议。

manifest unknown 错误

先检查 Docker 版本,版本过低则升级;版本正常则验证镜像信息是否正确。

镜像拉取成功后,如何去掉轩辕镜像域名前缀?

使用 docker tag 命令为镜像打上新标签,去掉域名前缀,使镜像名称更简洁。

查看全部问题→

轩辕镜像下载加速使用手册

探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式

🔐

登录方式进行 Docker 镜像下载加速教程

通过 Docker 登录方式配置轩辕镜像加速服务,包含7个详细步骤

🐧

Linux Docker 镜像下载加速教程

在 Linux 系统上配置轩辕镜像源,支持主流发行版

🖥️

Windows/Mac Docker 镜像下载加速教程

在 Docker Desktop 中配置轩辕镜像加速,适用于桌面系统

📦

Docker Compose 镜像下载加速教程

在 Docker Compose 中使用轩辕镜像加速,支持容器编排

📋

K8s containerd 镜像下载加速教程

在 k8s 中配置 containerd 使用轩辕镜像加速

🔧

宝塔面板 Docker 镜像下载加速教程

在宝塔面板中配置轩辕镜像加速,提升服务器管理效率

💾

群晖 NAS Docker 镜像下载加速教程

在 Synology 群晖NAS系统中配置轩辕镜像加速

🐂

飞牛fnOS Docker 镜像下载加速教程

在飞牛fnOS系统中配置轩辕镜像加速

📱

极空间 NAS Docker 镜像下载加速教程

在极空间NAS中配置轩辕镜像加速

⚡

爱快路由 ikuai Docker 镜像下载加速教程

在爱快ikuai系统中配置轩辕镜像加速

🔗

绿联 NAS Docker 镜像下载加速教程

在绿联NAS系统中配置轩辕镜像加速

🌐

威联通 NAS Docker 镜像下载加速教程

在威联通NAS系统中配置轩辕镜像加速

📦

Podman Docker 镜像下载加速教程

在 Podman 中配置轩辕镜像加速,支持多系统

📚

ghcr、Quay、nvcr、k8s、gcr 等仓库下载镜像加速教程

配置轩辕镜像加速9大主流镜像仓库,包含详细配置步骤

🚀

专属域名方式进行 Docker 镜像下载加速教程

无需登录即可使用轩辕镜像加速服务,更加便捷高效

需要其他帮助?请查看我们的 常见问题 或 官方QQ群: 13763429

商务:17300950906
|©2024-2025 源码跳动
商务合作电话:17300950906|Copyright © 2024-2025 杭州源码跳动科技有限公司. All rights reserved.