
riskledger/pgvectorpgvector/pgvector 是一个预集成 PostgreSQL 数据库与 pgvector 扩展的 Docker 镜像。该镜像基于官方 PostgreSQL 构建,默认预装并启用 pgvector 扩展,提供向量数据类型支持及高效相似性搜索能力,简化需要向量操作的应用部署流程。
vector 类型,支持存储高维向量(默认最大维度为 ***)。<->)、内积(<#>)、余弦相似度(<=>)等。16-alpine 标签对应 PostgreSQL 16 + pgvector 最新版)。适用于需要向量存储与相似性计算的场景,包括但不限于:
通过以下命令快速启动容器:
bashdocker run -d \ --name pgvector-db \ -p 5432:5432 \ -e POSTGRES_USER=myuser \ -e POSTGRES_PASSWORD=mypassword \ -e POSTGRES_DB=mydb \ -v pgdata:/var/lib/postgresql/data \ pgvector/pgvector:16-alpine
创建 docker-compose.yml 文件,定义服务与持久化存储:
yamlversion: '3.8' services: pgvector: image: pgvector/pgvector:16-alpine container_name: pgvector-db ports: - "5432:5432" environment: POSTGRES_USER: myuser POSTGRES_PASSWORD: mypassword POSTGRES_DB: mydb volumes: - pgdata:/var/lib/postgresql/data restart: unless-stopped volumes: pgvector-data: # 持久化卷,避免数据丢失
通过环境变量自定义容器行为,支持 PostgreSQL 官方镜像的所有环境变量,核心参数如下:
| 环境变量名 | 说明 | 默认值 |
|---|---|---|
POSTGRES_USER | 数据库超级用户账号 | postgres |
POSTGRES_PASSWORD | 超级用户密码(必填,否则容器启动失败) | 无 |
POSTGRES_DB | 初始化数据库名称 | 与 POSTGRES_USER 同名 |
PGDATA | PostgreSQL 数据存储路径 | /var/lib/postgresql/data |
POSTGRES_INITDB_ARGS | 初始化数据库时的额外参数(如字符集) | 无 |
使用 psql 客户端连接容器内数据库:
bashdocker exec -it pgvector-db psql -U myuser -d mydb
sql-- 创建含向量列的表(向量维度为 3) CREATE TABLE items ( id SERIAL PRIMARY KEY, embedding vector(3) -- vector(维度) 定义向量类型 );
sqlINSERT INTO items (embedding) VALUES ('[1, 2, 3]'), ('[4, 5, 6]'), ('[7, 8, 9]');
sql-- 查询与目标向量 [3, 1, 2] 欧氏距离最近的 2 条记录 SELECT id, embedding, embedding <-> '[3, 1, 2]' AS distance FROM items ORDER BY distance LIMIT 2; -- 结果示例: -- id | embedding | distance -- ----+-----------+------------------- -- 1 | [1,2,3] | 2.449489742783178 -- 2 | [4,5,6] | 5.916079783099616
sql-- 为 embedding 列创建 IVFFlat 索引(适用于中小规模数据) CREATE INDEX items_embedding_idx ON items USING ivfflat (embedding vector_cosine_ops) WITH (lists = 100);
为避免容器重启导致数据丢失,需挂载 PostgreSQL 数据目录到 Docker 卷或宿主机路径:
bash# 使用命名卷(推荐) docker run -d \ -v pgvector-data:/var/lib/postgresql/data \ ... # 其他参数 # 或挂载宿主机目录 docker run -d \ -v /path/on/host:/var/lib/postgresql/data \ ... # 其他参数
<postgresql-version>-<variant>(如 16-alpine),需根据应用需求选择 PostgreSQL 版本(pgvector 要求 PostgreSQL ≥ 11)。vector 类型默认最大维度为 ***,超出需通过 max_vector_dimension 参数调整(需修改 postgresql.conf)。




manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务