微软于周四宣布,其“副驾驶视觉”(Copilot Vision)功能已正式面向美国用户开放。这项技术赋予电脑“看见”屏幕内容的能力——当然,前提是用户主动授权。

Cover Image

这项创新功能本质上取代了传统求助方式——无论是图文教程、抖音(TikTok)短视频还是其他指导内容。当用户通过语音提问时,它能实时“观察”屏幕内容,逐步引导用户完成操作流程。该技术最初在微软雷德蒙总部50周年庆典亮相,后通过Insider测试渠道发布。笔者实测发现效果参差不齐:在Photoshop等专业软件中能精准定位具体菜单指令,但对微软经典纸牌游戏(Solitaire)等基础应用却存在识别障碍。

微软如今承诺该功能已趋于完善。相较于早期测试版本主要实现两大升级:其一是新增视觉高亮指引功能,使操作路径更为直观;其二是支持同时处理两个应用程序的视觉分析。值得注意的是,该功能需手动开启,并需指定授权访问的应用程序。与定期截屏的“Windows回溯”(Windows Recall)不同,它不具备长期记忆功能——测试显示其仅能处理当前可视界面内容,滚动页面后即“遗忘”先前内容。

虽然常被归类为AI技术,但其是否符合经典AI定义尚存争议。微软暗示该技术需要NPU(神经处理单元)支持,但官方公告未明确硬件要求。实测中,搭载初代酷睿Ultra处理器的设备响应延迟达10秒以上,而新型Copilot+PC则表现流畅。

微软发言人特别澄清:该功能适用于所有Windows 10/11用户。尽管可能面临与“回溯”功能相似的隐私质疑,但其内置的局限性设计——如无后台记录、需主动触发等特点——或许能缓解用户对间谍软件的担忧。不过就实用价值而言,目前体验仍显不足。


文章标签: #微软 #AI助手 #屏幕识别 #实时指导 #Windows

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。