2026年6月9日,由前Uber工程师Debo Ray和Rob Fletcher创立的DevZero正式发布了其自主基础设施优化平台。这个平台不仅能将Kubernetes集群的计算账单降低30%至60%,更重要的是开发了一项独特的能力——Checkpoint-Restore实时迁移,可以在不重启的情况下即时迁移Kubernetes工作负载。
Checkpoint-Restore:运维的「后悔药」
DevZero的Checkpoint-Restore能力解决了运维团队最大的心理障碍:对自主优化的不信任。传统上,基础设施团队不愿让任何系统自主管理计算资源,因为缩减配置的代价可能是宕机。正如CEO Debo Ray所言:「削减云账单如果结果是宕机就不值得。」
Checkpoint-Restore的工作原理是:持续对工作负载进行快照,当需要迁移时(如可用区故障、资源紧张),可以在秒级内将工作负载透明地迁移到其他节点,完全不需要重启。客户DataBahn的架构负责人分享了一个实际案例:「在一次可用区故障期间,DevZero透明地迁移了我们的工作负载,不需要任何重启或人工干预。这种级别的弹性给了我们更激进地推进基础设施优化的信心。」
3000+实例类型的智能调度
DevZero的优化引擎覆盖了AWS、Azure、GCP、OCI和OpenShift等平台,支持3000多种实例类型、69000多个价格点和23种GPU型号。其Profiler持续监控集群、节点和单个工作负载,建立资源需求的统计模型,从而实现精准的实时资源配置调整。
小编有话说
DevZero的Checkpoint-Restore能力正在改变运维团队对「自主优化」的态度。当你可以随时「撤销」资源调整而不影响业务时,优化策略就可以从保守转向激进。对于运维团队来说,这意味着云成本优化的ROI将显著提升——毕竟,最贵的资源是那些「以防万一」而预留的闲置容量。
评论 (0)