Skip to content
共绩算力文档中心

功能概览

平台支持 GPU 资源独占模式:

  • 物理级独占:整张 GPU 卡(含显存)由用户独享,无虚拟化层损耗
  • 多种高端 GPU 可选:RTX 4090、H20、L20、L40、H800 等卡型,满足不同规模与场景的算力需求
  • 无需担心设备短缺:随时获得所需资源,保障 AI 开发与训练的连续性
  • 性能稳定可靠:所有镜像均在真实 GPU 环境下严格验证,适配高强度计算任务

适用于对计算稳定性要求极高的 AI 模型训练、大模型微调等场景。

平台支持对象存储的加速挂载能力:

  • 共享存储卷挂载:将共享存储以挂载方式接入运行环境
  • 提升数据访问效率:简化大模型文件、数据集读取流程,避免重复下载
  • 数据安全可靠:确保数据永不丢失,支持训练数据的持久化保存
  • 多机共享访问:分布式训练场景下,多节点可同时访问同一数据源

适用于需要频繁访问大规模训练数据(10GB+)的 AI 模型开发场景。

支持共享存储卷挂载:

  • 多实例数据协同:多个 GPU 实例可共享同一存储卷,实现数据集统一管理与访问
  • Checkpoint 持久化:训练过程中的模型权重、日志实时写入共享存储,防止实例释放数据丢失
  • 支持分布式任务的数据协同:多机分布式训练时,各节点共享读取训练数据,写入结果至统一存储
  • 极速发布与分发:镜像与数据一键分发至多个环境,提升部署效率

适用于分布式深度学习、大规模模型微调等需要数据共享与协同处理的场景。

  • 预装 30 余款开发工具:涵盖 Jupyter Lab、VS Code Server、Web Shell 等,开发环境一键就绪
  • 主流 AI 框架支持:PyTorch、TensorFlow 全家桶等预装配置,免去环境配置烦恼
  • 镜像版本管理:支持镜像版本控制,便于环境复现与 A/B 测试
  • 自定义启动命令:支持 supervisord 进程管理,灵活配置服务启动流程
  • 镜像严格验证:所有镜像均在真实 GPU 环境下测试,确保性能稳定
  • 一键发布上线:开发完成后可一键发布为 Serverless 在线服务
  • 多环境分发:支持镜像快速复制至不同区域或集群,保障业务连续性