
gpustack/gpustack
gpustack
负责对用于运行大型语言模型(LLMs)的GPU集群进行全面管理,涵盖集群资源的动态调度、节点状态的实时监控、计算任务的高效分配、硬件性能的持续优化及故障的快速响应与处理,以确保LLMs在训练过程中的算力稳定供给和推理服务的高效运行,满足各类AI应用对大规模并行计算能力的需求。
11 次收藏10万+ 次下载
15 天前更新

gpustack/runner
gpustack
暂无描述
5万+ 次下载
16 天前更新

gpustack/runtime
gpustack
暂无描述
1万+ 次下载
16 天前更新

gpustack/build-cache
gpustack
暂无描述
1万+ 次下载
15 天前更新

gpustack/runner-build-cache
gpustack
暂无描述
1万+ 次下载
17 天前更新
第 1 页