苹果(Apple)可不会介意耍点小聪明来抢竞争对手的风头——毕竟,用“巧合”来解释苹果看似随意地透露新Siri的几项代理功能,实在难以令人信服,更何况这则消息的发布时间,恰好选在谷歌(Google)I/O活动开始前的几个小时。

来看苹果最新的无障碍智能功能:VoiceOver、放大镜(Magnifier)、语音控制(Voice Control)和无障碍阅读器(Accessibility Reader)。
苹果刚刚发布了四项重点无障碍主题的苹果智能(Apple Intelligence)功能,这些功能很可能会随iOS 27一同首次亮相。苹果智能的VoiceOver和放大镜功能旨在帮助视力障碍或视力衰退的人群。
VoiceOver中的图像探索(Image Explorer)工具依托苹果智能,能给出图片(包括照片和扫描单据)的详细描述。当用户按下iPhone上的操作按钮时,VoiceOver会利用升级后的实时识别(Live Recognition)功能,回答取景器内所有物体相关的问题。
放大镜将视觉描述带入了高对比度界面。放大镜应用可通过语音指令(如“放大”或“打开手电筒”)进行控制,并支持通过操作按钮快速回答视觉查询。
请帮我确认一下我的想法是否正确——苹果这显然是悄无声息地将代理式AI整合进了iPhone?没错,在这个视频里,它用于语音控制,但既然人能用自然语言控制iPhone,那AI代理同样也可以!
语音控制能让你通过基于自然语言的语音指令来控制iPhone及其中的应用程序。凭借“所见即所说”功能,用户可以操控任何应用,包括那些具有视觉布局的,例如苹果地图(Apple Maps)。
无障碍阅读器让浏览文字密集、内容复杂的文本变得相对轻松,主要面向有阅读障碍等各类残障的读者。它支持按需生成摘要和高保真翻译。
其他功能:
借助苹果智能的设备端语音识别,你现在可以为苹果生态系统中的任何视频生成字幕。
你可以通过美国的Tolt和LUCI驱动系统,用你的Vision Pro控制轮椅。
visionOS中的车辆运动提示(Vehicle Motion Cues)有助于减少在车内使用苹果Vision Pro的乘客的晕车感。你还可以通过停留控制(Dwell Control)用眼球移动来选择元素。
姓名识别(Name Recognition)可以在听到用户名字时通知有听力障碍的用户。
正如我们之前指出的,这些功能发布的时机实在过于巧合,很难让人相信只是偶然,尤其是在谷歌I/O大会前夕——谷歌很可能会在大会上展示一系列由Gemini驱动的代理功能。
请注意,目前最多产的苹果爆料人之一、彭博社(Bloomberg)的马克·古尔曼(Mark Gurman)最近承认,苹果在未来一两年内都无法赶上Gemini当前的能力。这一表态的背景是,谷歌最近为安卓17(Android 17)发布了令人印象深刻的Gemini智能功能。
因此,从苹果的角度来看,试图用今天的发布来抢占谷歌的一些风头是完全合理的,尤其是在人们普遍认为苹果在AI领域的落后将持续相当一段时间的情况下。



