高性能分布式计算引擎

IDP Engine包括集群管理和高性能计算引擎两大核心功能,

帮助客户提升资源利用率和大规模分布式计算性能,降低AI计算成本

精细化的资源调度

>50% 的资源利用率提升

精细

Task级别的资源调度,支持抢占式调度和动态迁移,最大化资源利用率

解耦

开发和计算(训练与推理)所需资源进行解耦,降低资源的闲置

断点续跑

支持进程级别断点续跑和自动休眠(Hibernate),减少资源和训练时间的浪费

高性能分布式计算

8-10倍的计算性能提升

精细

Task级别的资源调度,支持抢占式调度和动态迁移,最大化资源利用率

解耦

开发和计算(训练与推理)所需资源进行解耦,降低资源的闲置