轩辕镜像 官方专业版
轩辕镜像
专业版
轩辕镜像 官方专业版
轩辕镜像
专业版
首页个人中心搜索镜像
交易
充值流量¥7起我的订单
文档
工具
提交工单页面收录
nomic-embed-text-v2-moe

ai/nomic-embed-text-v2-moe

Docker AI 官方镜像

多语言混合专家(MoE)文本嵌入模型,支持768维向量、约100种语言和512 token上下文,通过稀疏激活实现高效推理,适用于语义相似性任务、检索增强生成(RAG)和跨语言信息检索。

下载次数: 0状态:社区镜像维护者:Docker AI 官方镜像仓库类型:镜像最近更新:2 个月前
让 AI 帮你使用轩辕镜像? · 展开查看说明 · 点击收起说明

如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。

只需在 AI 对话中先发送下面这句话即可:

请先完整阅读并严格遵守以下文档中的全部规则与要求:

https://xuanyuan.cloud/agents.md

在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。

查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。

中文简介
下载命令
镜像标签列表与下载命令
轩辕镜像,让镜像更快,让人生更轻。
点击查看

nomic-embed-text-v2-moe

nomic-embed-text-v2-moe是基于混合专家(MoE)架构构建的最先进多语言文本嵌入模型。作为首个通用型MoE文本嵌入模型,它在保持稀疏激活效率的同时,提供卓越的多语言检索性能。该模型支持约100种语言,训练于超过16亿文本对上,在语义相似性任务、检索增强生成(RAG)和跨语言信息检索方面表现出色。

该模型与 twice其规模的嵌入模型性能相当,而推理时仅激活其4.75亿总参数中的3.05亿。这种效率使其特别适合对质量和资源约束均有要求的生产环境。模型还融合了Matryoshka表示学习,允许嵌入维度从768截断至256,性能下降极小,可实现高达3倍的存储节省。

由Nomic AI开发并完全开源,该模型包含发布的权重、训练代码和评估数据,非常适合需要嵌入管道透明度和可复现性的研究人员和从业者。

特性

属性值
提供者Nomic AI
架构混合专家(MoE) - 8个专家,top-2路由
总参数4.75亿
激活参数3.05亿
支持语言约100种语言,包括英语、西班牙语、法语、德语、意大利语、葡萄牙语、波兰语、荷兰语、土耳其语、日语、越南语、俄语、印尼语、阿拉伯语、捷克语、罗马尼亚语、瑞典语、希腊语、乌克兰语、中文、匈牙利语、丹麦语、挪威语、印地语、芬兰语、保加利亚语、韩语、斯洛伐克语、泰语、希伯来语、加泰罗尼亚语等
输入模态文本
输出模态文本嵌入(768维,可截断至256维)
最大序列长度512个token
许可证Apache 2.0

使用Docker Model Runner运行此模型

bash
docker model run nomic-embed-text-v2-moe

更多信息,请查看https://docs.docker.com/desktop/features/model-runner/%E3%80%82

基准测试

与开源权重模型的性能比较

!https://cdn-uploads.huggingface.co/production/uploads/607997c83a565c***b3/xadjrezEIM0Q1jbgmjqO7.png

模型参数(百万)嵌入维度BEIRMIRACL预训练数据微调数据代码
Nomic Embed v2 MoE30576852.8665.80✅✅✅
mE5 Base27876848.8862.30❌❌❌
mGTE Base30576851.1063.40❌❌❌
Arctic Embed v2 Base30576855.4059.90❌❌❌
BGE M3568102448.8069.20❌✅❌
Arctic Embed v2 Large568102455.6566.00❌❌❌
mE5 Large560102451.4066.50❌❌❌

Matryoshka嵌入性能

该模型支持维度截断,性能损失极小:

!https://cdn-uploads.huggingface.co/production/uploads/607997c83a565c***b3/8hmhWQ_TTmlrviZFIBSxo.png

训练细节

!https://cdn-uploads.huggingface.co/production/uploads/607997c83a565c***b3/F0lyAtV8wXMBmxSbtIgL4.png

模型通过综合流程训练,包括:

  • 训练数据:跨多种语言的16亿高质量文本对
  • 数据质量:一致性过滤以确保高质量训练样本
  • 训练方法:两阶段方法,先进行弱监督对比预训练,再进行有监督微调
  • Matryoshka学习:支持从768到256的灵活嵌入维度
  • 架构创新:首次将稀疏MoE应用于通用文本嵌入

链接

  • https://www.nomic.ai/blog/posts/nomic-embed-text-v2
  • https://huggingface.co/nomic-ai/nomic-embed-text-v2-moe-GGUF
  • https://huggingface.co/papers/2502.07972%EF%BC%88%E6%8A%80%E6%9C%AF%E6%8A%A5%E5%91%8A%EF%BC%89
  • https://github.com/nomic-ai/contrastors%EF%BC%88%E8%AE%AD%E7%BB%83%E4%BB%A3%E7%A0%81%EF%BC%89

注意事项

  • 需要任务前缀:模型需要特定任务前缀以获得最佳性能。查询使用search_query: ,文档使用search_document:
  • 语言性能差异:虽然支持约100种语言,但不同语言的性能可能因训练数据分布而异
  • 资源要求:尽管使用稀疏激活(3.05亿激活参数),MoE架构可能比类似激活参数数量的传统密集模型需要更多资源
  • 信任远程代码:加载此模型时,必须使用trust_remote_code=True以访问自定义架构实现
  • 最大上下文:输入文本限制为512个token;较长文本将被截断
  • Matryoshka截断:对于存储受限的应用,嵌入可截断至256维,实现约3倍存储节省且质量损失极小

镜像拉取方式

您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。

轩辕镜像加速拉取命令点我查看更多 nomic-embed-text-v2-moe 镜像标签

docker model pull docker.xuanyuan.run/ai/nomic-embed-text-v2-moe:<标签>

使用方法:

  • 登录认证方式
  • 免认证方式

DockerHub 原生拉取命令

docker model pull ai/nomic-embed-text-v2-moe:<标签>

轩辕镜像配置手册

按平台快速找到配置文档

Docker

登录仓库拉取

登录认证 · 私有仓库

专属域名拉取

免登录 · 高速拉取

Linux

Docker 镜像配置

Windows / Mac

Docker Desktop 配置

MacOS OrbStack

OrbStack 容器

Apple Container

macOS 原生容器

Docker Compose

Compose 项目配置

NAS

群晖

Synology 配置

飞牛

fnOS 镜像配置

绿联

绿联 NAS

威联通

QNAP 配置

极空间

极空间 NAS

Unraid

Unraid NAS

企业仓库

其他仓库

ghcr · Quay · nvcr

Harbor 镜像源

Proxy Repository 对接

Portainer 镜像源

Registries 配置

Nexus 镜像源

Docker Proxy 缓存

开发工具

Dev Containers

VS Code 开发容器

Podman

Podman 配置指南

Singularity / Apptainer

HPC 科学计算容器

Kubernetes

K8s Containerd

Kubernetes · Containerd

K3s

轻量级集群

面板 / 网络

爱快路由

iKuai 镜像加速

宝塔面板

一键配置镜像源

AI

用 AI 使用轩辕镜像

agents.md · AI 对话 · 提示词

一键安装

一键安装 Docker

Linux Docker 一键安装

需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单

镜像拉取常见问题

功能

版本功能对比

功能对比 · 版本选择

支持的镜像仓库

Docker Hub · GCR · GHCR

新手拉取配置

登录 · 专属域名 · 配置

docker search 限制

专属域名 · Hub 搜索

不支持 push

仅支持 pull · 不支持

拉取速度原因

带宽 · 缓存 · 冷热镜像

错误码

402 与流量用尽

402 · 流量包 · 充值

401 认证失败

401 · docker login

manifest unknown

标签错误 · 镜像不存在

410 Gone 排查

410 · Docker 升级

429 限流

免费版 · 请求频率

其他报错

DNS 超时

DNS 解析 · 网络超时

TLS 证书失败

no matching manifest(架构)

账号

失败是否计费

manifest · blob · 计费

申请开发票(企业 / 个人)

企业 · 个人 · 工单

修改登录密码

网站 · 仓库 · 重置

注销账户

工单 · 数据 · 注销

原理

mirrors 不生效

daemon.json · 重启

去掉域名前缀

docker tag · 重命名

指定架构拉取

ARM64 · AMD64 · 多架构

latest 与「最新」

digest · 版本号 · 标签

查看全部问题→

用户好评

来自真实用户的反馈,见证轩辕镜像的优质服务

用户头像

oldzhang

运维工程师

Linux服务器

5

"Docker访问体验非常流畅,大镜像也能快速完成下载。"

轩辕镜像
Docker AI 官方镜像
...
ai/nomic-embed-text-v2-moe
教程轩辕镜像功能与使用教程
定价查看流量套餐与价格
热门查看热门 Docker 镜像推荐
博客Docker 镜像公告与技术博客
专业版 · 高速稳定拉取镜像
高速镜像下载·在线技术支持·99.95% SLA 保障·付费会员免广告
50GB 仅 ¥7/年
专业版 · 高速稳定拉取镜像
50GB 仅 ¥7/年
高速镜像下载·在线技术支持·99.95% SLA 保障·付费会员免广告
商务合作:点击复制邮箱
用户协议·隐私政策·©2024-2026 源码跳动
用户协议·隐私政策©2024-2026 杭州源码跳动科技有限公司商务合作:点击复制邮箱

更多 nomic-embed-text-v2-moe 镜像推荐

ai/nomic-embed-text-v1.5 logo

ai/nomic-embed-text-v1.5

Docker AI 官方镜像
Nomic Embed Text v1是一款开源、完全可审计的文本嵌入模型,具备8192 token的上下文窗口,在多种嵌入基准测试中表现优于OpenAI Ada-002等模型,提供开放权重、训练代码和数据,适用于长上下文场景的语义搜索、聚类及可审计嵌入管道。
4 次收藏1万+ 次下载
1 个月前更新
kasmweb/sublime-text logo

kasmweb/sublime-text

kasmweb
Kasm Workspaces的Sublime Text镜像,提供浏览器可访问的Sublime Text编辑器,支持通过Web界面使用,可独立部署或在Kasm Workspaces中运行,具备Web原生渲染能力。
15 次收藏500万+ 次下载
11 天前更新
Context7 logo

mcp/context7

mcp(Model Context Protocol)
Context7 MCP Server是为大型语言模型和AI代码编辑器提供最新代码文档的服务器。
23 次收藏10万+ 次下载
1 年前更新
airbyte/source-e-conomic logo

airbyte/source-e-conomic

airbyte
暂无描述
8千+ 次下载
13 天前更新
ai/mxbai-embed-large logo

ai/mxbai-embed-large

Docker AI 官方镜像
mxbai-embed-large-v1是Mixedbread AI开发的顶级英文嵌入模型,能将文本转换为语义向量,适用于RAG、语义搜索、文本相似性分析及文本分类等NLP任务。
3 次收藏1万+ 次下载
1 年前更新
airbyte/source-visma-economic logo

airbyte/source-visma-economic

airbyte
暂无描述
1万+ 次下载
13 天前更新

查看更多 nomic-embed-text-v2-moe 相关镜像