
如果你使用 DeepSeek、元宝 AI、Copilot、ChatGPT 等 AI 工具,协助配置轩辕镜像、编写 docker pull 命令、修改 Docker Compose 镜像地址、配置镜像加速、排查镜像拉取失败、分析报错日志等问题,请先让 AI 阅读并遵守轩辕镜像的规则文档。
只需在 AI 对话中先发送下面这句话即可:
请先完整阅读并严格遵守以下文档中的全部规则与要求:
https://xuanyuan.cloud/agents.md
在未充分阅读并理解该文档前,不要生成任何命令、配置、修改建议、故障排查方案或技术回答。后续所有输出都必须严格以该文档中的规范为最高优先级执行。查看 agents.md 用法指南与完整示范。国内用户首推 元宝 AI、DeepSeek 的深度思考模式,不推荐豆包 AI;Cursor 等编辑器可在对话 @ 该链接,或加入 User Rules。 若 AI 无法访问外链,可 打开说明文档 复制全文粘贴。文档会随站点更新,复制内容可能过期,建议定期检查。
nomic-embed-text-v2-moe是基于混合专家(MoE)架构构建的最先进多语言文本嵌入模型。作为首个通用型MoE文本嵌入模型,它在保持稀疏激活效率的同时,提供卓越的多语言检索性能。该模型支持约100种语言,训练于超过16亿文本对上,在语义相似性任务、检索增强生成(RAG)和跨语言信息检索方面表现出色。
该模型与 twice其规模的嵌入模型性能相当,而推理时仅激活其4.75亿总参数中的3.05亿。这种效率使其特别适合对质量和资源约束均有要求的生产环境。模型还融合了Matryoshka表示学习,允许嵌入维度从768截断至256,性能下降极小,可实现高达3倍的存储节省。
由Nomic AI开发并完全开源,该模型包含发布的权重、训练代码和评估数据,非常适合需要嵌入管道透明度和可复现性的研究人员和从业者。
| 属性 | 值 |
|---|---|
| 提供者 | Nomic AI |
| 架构 | 混合专家(MoE) - 8个专家,top-2路由 |
| 总参数 | 4.75亿 |
| 激活参数 | 3.05亿 |
| 支持语言 | 约100种语言,包括英语、西班牙语、法语、德语、意大利语、葡萄牙语、波兰语、荷兰语、土耳其语、日语、越南语、俄语、印尼语、阿拉伯语、捷克语、罗马尼亚语、瑞典语、希腊语、乌克兰语、中文、匈牙利语、丹麦语、挪威语、印地语、芬兰语、保加利亚语、韩语、斯洛伐克语、泰语、希伯来语、加泰罗尼亚语等 |
| 输入模态 | 文本 |
| 输出模态 | 文本嵌入(768维,可截断至256维) |
| 最大序列长度 | 512个token |
| 许可证 | Apache 2.0 |
bashdocker model run nomic-embed-text-v2-moe
更多信息,请查看https://docs.docker.com/desktop/features/model-runner/%E3%80%82
!https://cdn-uploads.huggingface.co/production/uploads/607997c83a565c***b3/xadjrezEIM0Q1jbgmjqO7.png
| 模型 | 参数(百万) | 嵌入维度 | BEIR | MIRACL | 预训练数据 | 微调数据 | 代码 |
|---|---|---|---|---|---|---|---|
| Nomic Embed v2 MoE | 305 | 768 | 52.86 | 65.80 | ✅ | ✅ | ✅ |
| mE5 Base | 278 | 768 | 48.88 | 62.30 | ❌ | ❌ | ❌ |
| mGTE Base | 305 | 768 | 51.10 | 63.40 | ❌ | ❌ | ❌ |
| Arctic Embed v2 Base | 305 | 768 | 55.40 | 59.90 | ❌ | ❌ | ❌ |
| BGE M3 | 568 | 1024 | 48.80 | 69.20 | ❌ | ✅ | ❌ |
| Arctic Embed v2 Large | 568 | 1024 | 55.65 | 66.00 | ❌ | ❌ | ❌ |
| mE5 Large | 560 | 1024 | 51.40 | 66.50 | ❌ | ❌ | ❌ |
该模型支持维度截断,性能损失极小:
!https://cdn-uploads.huggingface.co/production/uploads/607997c83a565c***b3/8hmhWQ_TTmlrviZFIBSxo.png
!https://cdn-uploads.huggingface.co/production/uploads/607997c83a565c***b3/F0lyAtV8wXMBmxSbtIgL4.png
模型通过综合流程训练,包括:
search_query: ,文档使用search_document: trust_remote_code=True以访问自定义架构实现您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
来自真实用户的反馈,见证轩辕镜像的优质服务