11 月 22 日消息,科技媒体 Android Authority 昨日(11 月 21 日)发布博文,报道称谷歌正为安卓 16 系统开发全新 API,可以让 Gemini 代表用户,操作其他应用交互。
现状
援引博文介绍,谷歌希望将 Gemini 打造成手机上的真正 AI 智能体,实现谷歌曾对 Pixel 4 的 Google Assistant 许下的承诺。
Gemini 目前主要通过扩展程序,访问 Google Flights、Google Hotels 等网络服务,从而在用户提出相关问题后,从中提取数据并回答相关问题。
但这种方式扩展性有限,难以覆盖海量 Android 应用。虽然理论上 Gemini 可通过屏幕阅读、多模态 AI 等技术控制任何应用,但效果并不理想。
进化:从扩展到 API
这个新 API 的核心是“应用功能”(app functions),应用开发者可以通过定义服务来创建相关功能,并将其分享给 Android 的 App Search 框架。
“应用功能”具有唯一标识符,例如“orderFood”,系统应用可以通过 EXECUTE_APP_FUNCTIONS 或 EXECUTE_APP_FUNCTIONS_TRUSTED 权限执行这些功能。
其中 EXECUTE_APP_FUNCTIONS_TRUSTED 权限具有更高的安全级别,应用开发者可以选择仅允许拥有此权限的应用执行其功能。