DevZero实时自主基础设施优化：不重启即可迁移Kubernetes工作负载

2026年6月9日，由前Uber工程师Debo Ray和Rob Fletcher创立的DevZero正式发布了其自主基础设施优化平台。这个平台不仅能将Kubernetes集群的计算账单降低30%至60%，更重要的是开发了一项独特的能力——Checkpoint-Restore实时迁移，可以在不重启的情况下即时迁移Kubernetes工作负载。

Checkpoint-Restore：运维的「后悔药」

DevZero的Checkpoint-Restore能力解决了运维团队最大的心理障碍：对自主优化的不信任。传统上，基础设施团队不愿让任何系统自主管理计算资源，因为缩减配置的代价可能是宕机。正如CEO Debo Ray所言：「削减云账单如果结果是宕机就不值得。」

Checkpoint-Restore的工作原理是：持续对工作负载进行快照，当需要迁移时（如可用区故障、资源紧张），可以在秒级内将工作负载透明地迁移到其他节点，完全不需要重启。客户DataBahn的架构负责人分享了一个实际案例：「在一次可用区故障期间，DevZero透明地迁移了我们的工作负载，不需要任何重启或人工干预。这种级别的弹性给了我们更激进地推进基础设施优化的信心。」

3000+实例类型的智能调度

DevZero的优化引擎覆盖了AWS、Azure、GCP、OCI和OpenShift等平台，支持3000多种实例类型、69000多个价格点和23种GPU型号。其Profiler持续监控集群、节点和单个工作负载，建立资源需求的统计模型，从而实现精准的实时资源配置调整。

小编有话说

DevZero的Checkpoint-Restore能力正在改变运维团队对「自主优化」的态度。当你可以随时「撤销」资源调整而不影响业务时，优化策略就可以从保守转向激进。对于运维团队来说，这意味着云成本优化的ROI将显著提升——毕竟，最贵的资源是那些「以防万一」而预留的闲置容量。

DevZero实时自主基础设施优化：不重启即可迁移Kubernetes工作负载

Checkpoint-Restore：运维的「后悔药」

3000+实例类型的智能调度

小编有话说

评论 (0)

意见反馈