
ai/stable-diffusion!row01
SD-XL 1.0-base是由Stability AI开发的扩散型文本到图像生成模型,基于潜在扩散模型(Latent Diffusion Model)架构,通过文本提示生成和修改图像。该模型采用专家集成管道,可单独使用基础模型生成图像,或配合精炼模型(SDXL Refiner)进行最终去噪以提升效果。模型使用两个预训练文本编码器(OpenCLIP-ViT/G和CLIP-ViT/L),支持多种图像生成场景,主要用于研究和创意领域。
!pipeline
SD-XL采用专家集成管道实现潜在扩散:
模型未针对事实性内容或真实人物/事件的准确呈现进行训练,此类场景不在模型能力范围内。
bash# 克隆仓库 git clone [***] cd generative-models # 安装依赖 pip install -e . # 运行基础模型推理示例(需根据仓库文档配置模型权重) python scripts/txt2img.py --prompt "a photo of a cat" --model sdxl_base
访问Clipdrop SDXL演示页面,输入文本提示直接生成图像。
!comparison
用户偏好评估显示:SDXL基础模型性能显著优于SDXL 0.9及Stable Diffusion 1.5/2.1;与精炼模型结合后,整体性能达到最佳。
图像生成模型虽能力强大,但可能强化或加剧社会偏见,使用时需注意伦理考量。





manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务