功能特性¶
算力集群提供基础设施能力,支持超大规模算力集群、异构 GPU 等一站式托管,并提供一系列如 vGPU 等软硬一体加速方案。
主要功能 | 细分项 |
---|---|
异构加速 | 支持 Nvidia、天数、昇腾等异构硬件加速 |
支持物理 GPU 单卡资源算力、显存、切分功能 | |
多个服务容器可共享单张GPU卡,并支持限制和隔离每个服务容器所占用的GPU算力、显存额度。保障服务间互不干扰,保障服务性能,提升资源利用效率 | |
支持按照项目对 GPU 资源进行配额管理 | |
集群全生命周期管理 | 集群的统一纳管:支持所有特定版本范围内的任意 Kubernetes 集群纳入容器管理范围,实现云上、云下、多云、混合云容器云平台的统一管理 |
基于 DaoCloud 自主开源项目 Kubean 支持通过 Web UI 界面快速部署企业级的 Kubernetes 集群,快速搭建企业级容器云台,适配物理机和虚拟机底层环境 | |
支持接入/创建集群,帮助用户构建一站式基础设施管理平台 | |
支持创建集群时指定运行时类型,支持 containerd、Docker 等多种运行时 | |
一键式集群升级:一键升级自建容器云平台的 Kubernetes 版本,统一管理系统组件升级 | |
集群高可用:内置集群容灾、备份能力,保障业务系统在主机故障、机房中断、自然灾害等情况下可恢复,提高生产环境的稳定性,降低业务中断风险 | |
节点管理:支持自建集群增删节点,保障集群能够满足业务需求 | |
集群运维 | 全方位集群监控:全方位覆盖集群、节点的指标监控及告警,实时了解和查看集群和节点状态,及时实施运维措施,保障业务连续性 |
开放式 API:提供原生的 Kubernetes OpenAPI 能力 | |
CloudShell 访问集群:支持通过 CloudShell 连接集群并通过 Kubectl 访问集群 |