
ai/qwen3-vlUnsloth提供的GGUF版本
!logo
Qwen3-VL——Qwen系列迄今最强大的视觉语言模型。
本代模型实现全面升级:卓越的文本理解与生成、更深入的视觉感知与推理、更长的上下文长度、增强的空间和视频动态理解能力,以及更强的智能体交互能力。
核心增强:
!arc
本仓库为Qwen3-VL-8B-Instruct的权重仓库。
| 模型变体 | 参数 | 量化方式 | 上下文窗口 | 显存¹ | 大小 |
|---|---|---|---|---|---|
ai/qwen3-vl:8Bai/qwen3-vl:8B-UD-Q4_K_XLai/qwen3-vl:latest | 8B | MOSTLY_Q4_K_M | 262K tokens | 5.91 GiB | 4.79 GB |
ai/qwen3-vl:2B-BF16 | 2B | MOSTLY_BF16 | 262K tokens | 4.38 GiB | 3.21 GB |
ai/qwen3-vl:2B-Q8_K_XL | 2B | MOSTLY_Q8_0 | 262K tokens | 3.34 GiB | 2.17 GB |
ai/qwen3-vl:2B-UD-Q4_K_XL | 2B | MOSTLY_Q4_K_M | 262K tokens | 2.22 GiB | 1.05 GB |
ai/qwen3-vl:4B-Q8_K_XL | 4B | MOSTLY_Q8_0 | 262K tokens | 6.13 GiB | 4.70 GB |
ai/qwen3-vl:8B-Q8_K_XL | 8B | MOSTLY_Q8_0 | 262K tokens | 10.36 GiB | 10.08 GB |
ai/qwen3-vl:32B-Q8_K_XL | 32B | MOSTLY_Q8_0 | 262K tokens | 37.46 GiB | 36.76 GB |
ai/qwen3-vl:32B-UD-Q4_K_XL | 32B | MOSTLY_Q4_K_M | 262K tokens | 20.41 GiB | 18.67 GB |
ai/qwen3-vl:4B-BF16 | 4B | MOSTLY_BF16 | 262K tokens | 8.92 GiB | 7.49 GB |
ai/qwen3-vl:8B-BF16 | 8B | MOSTLY_BF16 | 262K tokens | 15.54 GiB | 15.26 GB |
¹:显存基于模型特性估算。
latest→8B
运行模型:
bashdocker model run ai/qwen3-vl
更多信息,请查看Docker Model Runner文档。






manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务