
ai/embeddinggemma!logo
Embedding Gemma是Google DeepMind推出的最先进文本嵌入模型,旨在创建高质量的文本向量表示。该模型基于Gemma架构构建,能将文本转换为捕获语义含义的密集向量嵌入,非常适合检索增强生成(RAG)、语义搜索和相似性任务。凭借开放权重和高效设计,Embedding Gemma为基于嵌入的应用提供了强大基础。GGUF格式版本由Unsloth提供。
Embedding Gemma专为需要高质量文本嵌入的应用设计:
| 属性 | 详情 |
|---|---|
| 提供商 | Google DeepMind |
| 架构 | Gemma Embedding |
| 数据截止日期 | - |
| 支持语言 | 英语 |
| 工具调用 | ❌ |
| 输入模态 | 文本 |
| 输出模态 | 嵌入向量 |
| 许可证 | Gemma条款 |
| 模型变体 | 参数 | 量化 | 上下文窗口 | 显存¹ | 大小 |
|---|---|---|---|---|---|
ai/embeddinggemma:latestai/embeddinggemma:300M-Q8_0 | 300M | Q8_0 | 2K tokens | 1.43 GiB | 307.13 MB |
ai/embeddinggemma:300M-Q8_0 | 300M | Q8_0 | 2K tokens | 1.43 GiB | 307.13 MB |
¹: 显存基于模型特性估算。
latest→300M-Q8_0
首先,拉取模型:
bashdocker model pull ai/embeddinggemma
然后运行模型:
bashdocker model run ai/embeddinggemma
使用API生成嵌入:
bashcurl --location 'http://localhost:***/engines/llama.cpp/v1/embeddings' \ --header 'Content-Type: application/json' \ --data '{ "model": "ai/embeddinggemma", "input": "Your text to embed here" }'
有关Docker Model Runner的更多信息,请浏览文档。
| 任务类别 | Embedding Gemma |
|---|---|
| 检索 | 54.87 |
| STS | 78.53 |
| 分类 | 73.26 |
| 聚类 | 44.72 |
| 配对分类 | 85.94 |
| 重排序 | 59.36 |






manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务