
bytez/akaisora_sql-gen-joinAkaisora/sql-gen-join是一个专注于文本生成任务的Docker镜像,镜像名称为bytez/akaisora_sql-gen-join。该镜像提供本地部署的文本生成能力,需配合免费的Bytez API密钥使用,支持通过API接口进行文本生成请求。适用于需要隐私保护、定制化生成参数或本地资源控制的文本生成场景,如应用开发、实验环境部署等。
bashdocker pull bytez/akaisora_sql-gen-join
bashdocker run -it \ -e KEY=YOUR_BYTEZ_API_KEY_HERE \ -e PORT=8000 \ -p 8000:8000 \ bytez/akaisora_sql-gen-join
如需使用其他端口(如80):
bashdocker run -it \ -e KEY=YOUR_BYTEZ_API_KEY_HERE \ -e PORT=80 \ -p 80:80 \ bytez/akaisora_sql-gen-join
容器启动后,可通过POST请求调用文本生成服务。
bashcurl --location '[***] \ --header 'Content-Type: application/json' \ --data-raw '{ "text": "Once upon a time there was a ", "stream": false, "params": { "max_new_tokens": 50, "temperature": 1.3, "top_p": 1.2 } }'
设置"stream": true可获取流式响应(响应格式为text/event-stream; charset=utf-8):
bashcurl --location '[***] \ --header 'Content-Type: application/json' \ --data-raw '{ "text": "Once upon a time there was a ", "stream": true, "params": { "max_new_tokens": 50 } }'
为避免重复下载大模型权重(尤其适用于大型模型),可通过挂载本地目录实现权重持久化:
bashdocker run -it \ -v /本地缓存目录路径:/server/model \ -e HF_HOME=/server/model \ -e KEY=YOUR_BYTEZ_API_KEY_HERE \ -p 8000:8000 \ -e PORT=8000 \ bytez/akaisora_sql-gen-join
说明:-v参数将本地目录挂载到容器内/server/model路径,HF_HOME环境变量指定模型加载路径。
需安装Nvidia驱动和CUDA,运行时添加--gpus all参数:
bashdocker run -it \ --gpus all \ -e KEY=YOUR_BYTEZ_API_KEY_HERE \ -p 8000:8000 \ -e PORT=8000 \ bytez/akaisora_sql-gen-join
组合本地缓存和GPU加速功能:
bashdocker run -it \ --gpus all \ -v /本地缓存目录路径:/server/model \ -e HF_HOME=/server/model \ -e KEY=YOUR_BYTEZ_API_KEY_HERE \ -p 8000:8000 \ -e PORT=8000 \ bytez/akaisora_sql-gen-join
| 环境变量 | 说明 | 默认值 |
|---|---|---|
KEY | 必填,Bytez API密钥 | - |
PORT | 容器内部服务端口 | 8000 |
HF_HOME | 模型权重缓存目录(需配合-v挂载) | - |
DEVICE | 运行设备,可选值:auto(自动选择GPU/CPU)、cuda(强制GPU)、cpu(强制CPU) | auto |
max_length (int, 可选):生成文本的最大长度,默认20max_new_tokens (int, 可选):生成的新token最大数量(忽略输入prompt长度)min_length (int, 可选):生成文本的最小长度,默认0min_new_tokens (int, 可选):生成的新token最小数量(忽略输入prompt长度)early_stopping (bool或str, 可选):控制基于beam的生成停止条件,默认Falsemax_time (float, 可选):生成计算的最大时间限制do_sample (bool, 可选):是否使用采样而非贪婪解码,默认Falsenum_beams (int, 可选):beam搜索的beam数量,默认1num_beam_groups (int, 可选):beam组数量(用于多样性),默认1penalty_alpha (float, 可选):平衡模型置信度和退化惩罚use_cache (bool, 可选):是否使用缓存加速解码,默认Truetemperature (float, 可选):调整生成概率分布的温度参数,默认1.0top_k (int, 可选):保留top-k个最高概率token,默认50top_p (float, 可选):核采样阈值,默认1.0typical_p (float, 可选):局部典型性采样阈值,默认1.0repetition_penalty (float, 可选):重复惩罚参数,1.0表示无惩罚length_penalty (float, 可选):长度惩罚参数,>0促进长文本,<0促进短文本,默认1.0no_repeat_ngram_size (int, 可选):禁止重复n-gram的大小,默认0(不限制)num_return_sequences (int, 可选):返回的独立生成序列数量,默认1pad_token_id (int, 可选):填充token IDbos_token_id (int, 可选):序列开始token IDeos_token_id (int或List[int], 可选):序列结束token ID(可指定多个)完整参数列表可参考Hugging Face Transformers文档。



manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务