
allegroai/clearmlClearML Server 是 ClearML 的后端服务基础设施,前身为 Trains Server。它支持多用户协作管理实验,提供实验管理、ML-Ops和数据管理功能。ClearML提供免费托管服务,也可通过部署ClearML Server搭建私有服务。
ClearML Server支持两种配置模式:
确保端口8080、8081、8008可用。检查端口占用情况:
Linux/macOS:
bashsudo lsof -Pn -i4 | grep :8080 | grep LISTEN sudo lsof -Pn -i4 | grep :8081 | grep LISTEN sudo lsof -Pn -i4 | grep :8008 | grep LISTEN
Windows:
cmdnetstat -an | find /i "8080" netstat -an | find /i "8081" netstat -an | find /i "8008"
ClearML Server支持多种部署方式:
bashcurl [***] -o docker-compose.yml
bashdocker-compose -f docker-compose.yml up -d
运行clearml-init命令,按照提示完成服务器配置。
编辑~/clearml.conf文件,设置服务器地址:
yamlapi { # API服务器地址(端口8008) api_server: "http://localhost:8008" # Web服务器地址(端口8080) web_server: "http://localhost:8080" # 文件服务器地址(端口8081) files_server: "http://localhost:8081" }
注意:若使用子域配置,无需指定端口,将从http/s协议自动推断。
配置完成后,访问Web服务器(如http://localhost:8080)即可查看实验数据。
自ClearML Server 0.15版本起,容器化部署包含ClearML-Agent Services容器,作为ClearML-Agent的扩展,支持启动长期运行的任务(如自动扩展服务、控制器、优化器等)。
services队列中的任务,每个任务作为新节点注册到系统services队列,避免服务器负载过高支持配置Web界面登录认证,增强系统安全性,详见Web登录认证文档。
自动检测并处理非响应实验,避免资源浪费,详见非响应任务监控文档。
bashdocker-compose down docker-compose -f docker-compose.yml up -d
停止当前容器:
bashdocker-compose down
备份数据目录(假设数据目录为/opt/clearml):
bashsudo tar czvf ~/clearml_backup.tgz /opt/clearml/data
获取最新配置文件:
bashcurl [***] -o docker-compose.yml
配置环境变量(可选):
bashexport CLEARML_HOST_IP=服务器IP地址 export CLEARML_AGENT_GIT_USER=Git用户名 export CLEARML_AGENT_GIT_PASS=Git密码
启动最新版本:
bashdocker-compose -f docker-compose.yml pull docker-compose -f docker-compose.yml up -d
根据ElasticSearch最新报告,使用JDK9+的Elasticsearch 6.8.9+/7.8+版本因Java安全管理器限制,不受远程代码执行或信息泄露影响。
clearml标签提问Server Side Public License v1.0
ClearML Server依赖MongoDB和ElasticSearch,选择SSPL许可证以支持开源社区发展。
manifest unknown 错误
TLS 证书验证失败
DNS 解析超时
410 错误:版本过低
402 错误:流量耗尽
身份认证失败错误
429 限流错误
凭证保存错误
来自真实用户的反馈,见证轩辕镜像的优质服务