PostgresML 是 PostgreSQL 数据库的机器学习扩展,它把机器学习能力直接嵌入数据库内核,让数据处理、模型训练和预测推理能在同一系统内完成,不用再折腾数据迁移或跨平台集成。简单说,就是让你的数据库不仅能存数据,还能直接“学”数据、用数据做预测。
它的核心优势在于“原生集成”。传统做法里,数据团队得先把数据库里的数据导出到 Python 环境,用 Pandas 清洗、用 Scikit-learn 或 TensorFlow 训练模型,再把模型部署到另一套系统做预测——中间环节多、数据传输慢,还容易出安全风险。PostgresML 省去了这些麻烦:你可以直接用 SQL 写机器学习任务,比如用 SELECT train_model(...) 训练模型,用 SELECT predict(...) 调用模型预测,全程不用离开 PostgreSQL。
支持的模型也挺全,常见的机器学习算法基本都覆盖了:分类任务能用 XGBoost、LightGBM,回归问题可以跑 Linear Regression,NLP 任务能调用 BERT、GPT 等大语言模型,甚至还支持深度学习框架如 PyTorch、TensorFlow 的模型导入。数据预处理也能用 SQL 搞定,比如用 pgml.transform(...) 做特征工程,不用再切换到 Python 脚本。
对开发者和企业来说,这意味着效率大提升。数据不用导来导去,减少了 90% 以上的数据迁移成本;模型和数据存在同一系统,预测时直接读取最新数据,延迟能压到毫秒级,特别适合实时推荐、欺诈检测这类对速度敏感的场景。数据科学家和工程师也不用再各用一套工具:前者能用 SQL 快速验证模型思路,后者直接用数据库接口集成预测功能,协作效率高多了。
它还是开源的,代码托管在 GitHub,社区活跃,文档也比较全。如果你用 PostgreSQL 存数据,又需要机器学习能力,PostgresML 算是个“零门槛”的选择——不用额外搭环境,装个扩展就能用,尤其适合中小团队或需要快速落地 ML 应用的场景。
请登录使用轩辕镜像享受快速拉取体验,支持国内访问优化,速度提升
docker pull ghcr.io/postgresml/postgresml:2.9.3探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务