苹果(Apple)可不会介意耍点小聪明来抢竞争对手的风头——毕竟,用“巧合”来解释苹果看似随意地透露新Siri的几项代理功能,实在难以令人信服,更何况这则消息的发布时间,恰好选在谷歌(Google)I/O活动开始前的几个小时。

Apple-Intelligence-Siri.jpeg

来看苹果最新的无障碍智能功能:VoiceOver放大镜(Magnifier)语音控制(Voice Control)无障碍阅读器(Accessibility Reader)

苹果刚刚发布了四项重点无障碍主题的苹果智能(Apple Intelligence)功能,这些功能很可能会随iOS 27一同首次亮相。苹果智能的VoiceOver放大镜功能旨在帮助视力障碍或视力衰退的人群。

VoiceOver中的图像探索(Image Explorer)工具依托苹果智能,能给出图片(包括照片和扫描单据)的详细描述。当用户按下iPhone上的操作按钮时,VoiceOver会利用升级后的实时识别(Live Recognition)功能,回答取景器内所有物体相关的问题。

放大镜将视觉描述带入了高对比度界面。放大镜应用可通过语音指令(如“放大”或“打开手电筒”)进行控制,并支持通过操作按钮快速回答视觉查询。

请帮我确认一下我的想法是否正确——苹果这显然是悄无声息地将代理式AI整合进了iPhone?没错,在这个视频里,它用于语音控制,但既然人能用自然语言控制iPhone,那AI代理同样也可以!

语音控制能让你通过基于自然语言的语音指令来控制iPhone及其中的应用程序。凭借“所见即所说”功能,用户可以操控任何应用,包括那些具有视觉布局的,例如苹果地图(Apple Maps)

无障碍阅读器让浏览文字密集、内容复杂的文本变得相对轻松,主要面向有阅读障碍等各类残障的读者。它支持按需生成摘要和高保真翻译。

其他功能:

  • 借助苹果智能的设备端语音识别,你现在可以为苹果生态系统中的任何视频生成字幕。

  • 你可以通过美国的ToltLUCI驱动系统,用你的Vision Pro控制轮椅。

  • visionOS中的车辆运动提示(Vehicle Motion Cues)有助于减少在车内使用苹果Vision Pro的乘客的晕车感。你还可以通过停留控制(Dwell Control)用眼球移动来选择元素。

  • 姓名识别(Name Recognition)可以在听到用户名字时通知有听力障碍的用户。

正如我们之前指出的,这些功能发布的时机实在过于巧合,很难让人相信只是偶然,尤其是在谷歌I/O大会前夕——谷歌很可能会在大会上展示一系列由Gemini驱动的代理功能。

请注意,目前最多产的苹果爆料人之一、彭博社(Bloomberg)马克·古尔曼(Mark Gurman)最近承认,苹果在未来一两年内都无法赶上Gemini当前的能力。这一表态的背景是,谷歌最近为安卓17(Android 17)发布了令人印象深刻的Gemini智能功能。

因此,从苹果的角度来看,试图用今天的发布来抢占谷歌的一些风头是完全合理的,尤其是在人们普遍认为苹果在AI领域的落后将持续相当一段时间的情况下。


文章标签: #苹果 #AppleIntelligence #无障碍 #语音控制 #AI代理

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。