
Akaisora/sql-gen-join是一个专注于文本生成任务的Docker镜像,镜像名称为bytez/akaisora_sql-gen-join。该镜像提供本地部署的文本生成能力,需配合免费的Bytez API密钥使用,支持通过API接口进行文本生成请求。适用于需要隐私保护、定制化生成参数或本地资源控制的文本生成场景,如应用开发、实验环境部署等。
bashdocker pull bytez/akaisora_sql-gen-join
基本运行(默认端口8000)
bashdocker run -it \ -e KEY=YOUR_BYTEZ_API_KEY_HERE \ -e PORT=8000 \ -p 8000:8000 \ bytez/akaisora_sql-gen-join
自定义端口配置
如需使用其他端口(如80):
bashdocker run -it \ -e KEY=YOUR_BYTEZ_API_KEY_HERE \ -e PORT=80 \ -p 80:80 \ bytez/akaisora_sql-gen-join
容器启动后,可通过POST请求调用文本生成服务。
非流式请求
bashcurl --location 'http://0.0.0.0:8000/run' \ --header 'Content-Type: application/json' \ --data-raw '{ "text": "Once upon a time there was a ", "stream": false, "params": { "max_new_tokens": 50, "temperature": 1.3, "top_p": 1.2 } }'
流式请求
设置"stream": true可获取流式响应(响应格式为text/event-stream; charset=utf-8):
bashcurl --location 'http://0.0.0.0:8000/run' \ --header 'Content-Type: application/json' \ --data-raw '{ "text": "Once upon a time there was a ", "stream": true, "params": { "max_new_tokens": 50 } }'
为避免重复下载大模型权重(尤其适用于大型模型),可通过挂载本地目录实现权重持久化:
bashdocker run -it \ -v /本地缓存目录路径:/server/model \ -e HF_HOME=/server/model \ -e KEY=YOUR_BYTEZ_API_KEY_HERE \ -p 8000:8000 \ -e PORT=8000 \ bytez/akaisora_sql-gen-join
说明:-v参数将本地目录挂载到容器内/server/model路径,HF_HOME环境变量指定模型加载路径。
需安装Nvidia驱动和CUDA,运行时添加--gpus all参数:
bashdocker run -it \ --gpus all \ -e KEY=YOUR_BYTEZ_API_KEY_HERE \ -p 8000:8000 \ -e PORT=8000 \ bytez/akaisora_sql-gen-join
组合本地缓存和GPU加速功能:
bashdocker run -it \ --gpus all \ -v /本地缓存目录路径:/server/model \ -e HF_HOME=/server/model \ -e KEY=YOUR_BYTEZ_API_KEY_HERE \ -p 8000:8000 \ -e PORT=8000 \ bytez/akaisora_sql-gen-join
| 环境变量 | 说明 | 默认值 |
|---|---|---|
KEY | 必填,Bytez API密钥 | - |
PORT | 容器内部服务端口 | 8000 |
HF_HOME | 模型权重缓存目录(需配合-v挂载) | - |
DEVICE | 运行设备,可选值:auto(自动选择GPU/CPU)、cuda(强制GPU)、cpu(强制CPU) | auto |
max_length (int, 可选):生成文本的最大长度,默认20max_new_tokens (int, 可选):生成的新token最大数量(忽略输入prompt长度)min_length (int, 可选):生成文本的最小长度,默认0min_new_tokens (int, 可选):生成的新token最小数量(忽略输入prompt长度)early_stopping (bool或str, 可选):控制基于beam的生成停止条件,默认Falsemax_time (float, 可选):生成计算的最大时间限制do_sample (bool, 可选):是否使用采样而非贪婪解码,默认Falsenum_beams (int, 可选):beam搜索的beam数量,默认1num_beam_groups (int, 可选):beam组数量(用于多样性),默认1penalty_alpha (float, 可选):平衡模型置信度和退化惩罚use_cache (bool, 可选):是否使用缓存加速解码,默认Truetemperature (float, 可选):调整生成概率分布的温度参数,默认1.0top_k (int, 可选):保留top-k个最高概率token,默认50top_p (float, 可选):核采样阈值,默认1.0typical_p (float, 可选):局部典型性采样阈值,默认1.0repetition_penalty (float, 可选):重复惩罚参数,1.0表示无惩罚length_penalty (float, 可选):长度惩罚参数,>0促进长文本,<0促进短文本,默认1.0no_repeat_ngram_size (int, 可选):禁止重复n-gram的大小,默认0(不限制)num_return_sequences (int, 可选):返回的独立生成序列数量,默认1pad_token_id (int, 可选):填充token IDbos_token_id (int, 可选):序列开始token IDeos_token_id (int或List[int], 可选):序列结束token ID(可指定多个)完整参数列表可参考https://github.com/huggingface/transformers/blob/v4.38.2/src/transformers/generation/configuration_utils.py%E3%80%82
您可以使用以下命令拉取该镜像。请将 <标签> 替换为具体的标签版本。如需查看所有可用标签版本,请访问 标签列表页面。
探索更多轩辕镜像的使用方法,找到最适合您系统的配置方式
通过 Docker 登录认证访问私有仓库
无需登录使用专属域名
Kubernetes 集群配置 Containerd
K3s 轻量级 Kubernetes 镜像加速
VS Code Dev Containers 配置
Podman 容器引擎配置
HPC 科学计算容器配置
ghcr、Quay、nvcr 等镜像仓库
Harbor Proxy Repository 对接专属域名
Portainer Registries 加速拉取
Nexus3 Docker Proxy 内网缓存
需要其他帮助?请查看我们的 常见问题Docker 镜像访问常见问题解答 或 提交工单
docker search 限制
站内搜不到镜像
离线 save/load
插件要用 plugin install
WSL 拉取慢
安全与 digest
新手拉取配置
镜像合规机制
manifest unknown
no matching manifest(架构)
invalid tar header(解压)
TLS 证书失败
DNS 超时
域名连通性排查
410 Gone 排查
402 与流量用尽
401 认证失败
429 限流
D-Bus 凭证提示
413 与超大单层
来自真实用户的反馈,见证轩辕镜像的优质服务