SWEBENCH-VERIFIED(镜像名称:`slimshetty/swebench-verified`)是由R2E-Gym项目核心贡献者发布的容器化应用,专为SWE-Bench Verified基准提供预配置的运行环境。该镜像封装了基准数据集、测试工具与适配的运行时环境,旨在简化AI编程助手性能验证、基准工具开发与实验复现流程,避免手动搭建依赖的复杂性,确保实验结果的一致性与可复现性。
LMSYS Org 聚焦大模型系统与评测基础设施,代表项目包括 SGLang、Chatbot Arena(已毕业)、Vicuna LLM 等。在容器生态中,lmsysorg 提供 SGLang 等镜像,帮助团队快速搭建高性能推理与评测服务。