
volcengine/sandbox-fusion本镜像作为安全沙箱,专门用于运行和评判由大型语言模型(LLM)生成的代码。通过提供隔离的执行环境,确保LLM生成代码在运行过程中不会对主机系统造成安全威胁,同时支持对代码执行结果进行标准化评判。
作为后端沙箱运行用户通过LLM生成的代码,确保平台服务器安全
提供安全的代码执行环境,供学生运行LLM辅助生成的代码并获取反馈
用于检测LLM生成代码中的潜在安全风险(如漏洞、***逻辑)
对LLM生成的解决方案代码进行自动执行和正确性评判
bashdocker run -d \ --name llm-code-sandbox \ -e EXEC_TIMEOUT=30 \ -e MAX_MEMORY=512m \ -e SUPPORTED_LANGUAGES="python,js,java" \ -v ./code-input:/app/input \ -v ./results:/app/output \ llm-code-sandbox:latest
yamlversion: '3' services: code-sandbox: image: llm-code-sandbox:latest container_name: llm-code-sandbox environment: - EXEC_TIMEOUT=60 # 执行超时时间(秒) - MAX_MEMORY=1024m # 最大内存限制 - MAX_CPU=1 # 最大CPU核心数 - SUPPORTED_LANGUAGES=python,js,java,go # 支持的编程语言 - DISABLE_NETWORK=true # 禁用网络访问 volumes: - ./code-input:/app/input # 代码输入目录(外部代码挂载到此) - ./results:/app/output # 执行结果输出目录 - ./judge-rules:/app/rules # 自定义评判规则目录(可选) restart: unless-stopped
| 参数名 | 描述 | 默认值 | 取值范围 |
|---|---|---|---|
EXEC_TIMEOUT | 代码执行超时时间(秒) | 30 | 5-300 |
MAX_MEMORY | 最大内存使用限制 | 512m | 128m-2g |
MAX_CPU | 最大CPU核心数 | 1 | 0.5-4 |
MAX_DISK_IO | 最大磁盘IO限制(MB/s) | 10 | 1-50 |
SUPPORTED_LANGUAGES | 支持的编程语言(逗号分隔) | python,js,java | 支持的语言列表由镜像内置 |
DISABLE_NETWORK | 是否禁用网络访问 | true | true/false |
ENABLE_LOGGING | 是否启用执行日志记录 | true | true/false |
JUDGE_RULES_PATH | 自定义评判规则文件路径 | /app/rules/default.json | 有效的JSON文件路径 |
| 挂载路径 | 用途 | 权限要求 |
|---|---|---|
/app/input | 输入代码文件存放目录 | 只读(容器内) |
/app/output | 执行结果输出目录 | 读写 |
/app/rules | 自定义评判规则文件目录 | 只读(容器内) |
/var/log/sandbox | 沙箱执行日志目录 | 读写 |
代码执行完成后,结果将以JSON格式输出至/app/output/results.json,包含以下字段:
json{ "execution_id": "uuid-string", "status": "success|timeout|error|security_violation", "language": "python", "execution_time_ms": 1200, "memory_used_mb": 45, "stdout": "代码标准输出内容", "stderr": "代码错误输出内容", "return_code": 0, "judge_result": { "passed": true, "score": 95, "feedback": "代码逻辑正确,性能良好" } }
同时,详细执行日志可在/var/log/sandbox/execution.log中查看。




manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务