Article
AI Infra / Scheduling / Resource Management
当前重点负责 AI Infra 相关基础设施建设,覆盖大规模 GPU 集群的调度、资源管理与可视化平台能力。
有 10 万卡集群建设经验,持续关注训练集群的供给效率、资源利用率、系统稳定性与工程落地细节。
Engineering Snapshot