还有史诗级更新:iPhone 加通话录音,iPad 加计算器。
从主题、服装、配饰和地点等类别的一系列概念中进行选择; 输入描述来定义图像; 从个人照片库中选择某人加入图像中; 并选择最喜欢的风格。
多模态输入 / 输出。苹果启用了文本 / 音频 / 图像 / 视频读写功能。可以说,这些都是原生的人类 API。 Agentic。苹果允许操作系统和应用程序的所有部分通过「函数调用」进行互操作;内核进程 LLM 可根据用户查询安排和协调它们之间的工作。 无摩擦。苹果以一种高度流畅、快速、always on 和上下文的方式全面集成这些功能。无需四处复制粘贴信息、提示工程等。还对用户界面进行了相应调整。 主动性。苹果没有根据提示执行任务,而是预测提示、提出建议并主动执行任务。 分级授权。尽可能多地将智能移动到设备上(苹果芯片非常有帮助且适合),但允许将工作可选地派发到云端。 模块化。允许操作系统访问并支持整个不断增长的 LLM 生态系统(例如 ChatGPT 公告)。 隐私。