Chrome 148带来了一个重大里程碑:Prompt API正式进入稳定版(Stable),并升级为由Gemini Nano驱动的多模态版本。这意味着每一台安装了Chrome 148的设备,都内置了一个可以在本地运行的AI模型,能够处理文本、图像和结构化数据——完全不需要服务器往返。
Prompt API能做什么?
稳定版Prompt API的核心能力包括:文本生成与补全、图像理解与描述、结构化数据提取、语言翻译、文本摘要等。由于模型运行在设备本地,数据不会离开用户的设备,隐私性和响应速度都得到了保证。
对于前端开发者来说,这意味着可以直接在浏览器中调用AI能力,无需搭建后端API。一个典型场景是:用户在表单中粘贴一段自然语言描述,浏览器本地模型直接将其解析为结构化表单数据并填充——整个过程延迟极低,且用户数据完全不出设备。
多模态能力的场景想象
Gemini Nano的多模态支持打开了更多可能性。电商网站可以让用户在商品详情页拍照识别商品属性;内容平台可以在用户上传图片时自动生成alt文本;协作工具可以对截图中的文字进行实时OCR和翻译。这些场景以前需要调用云端API,现在可以在浏览器端秒级完成。
小编有话说
Prompt API的稳定化标志着「端侧AI」从前沿实验进入生产可用阶段。对于前端团队来说,现在就应该开始思考:在你的产品中,哪些交互可以被端侧AI重新定义?注意,端侧AI不是要替代云端大模型,而是将高频、低延迟、隐私敏感的场景交给本地处理,形成「端+云」的协同架构。
评论 (0)