苹果最新向开发者开放的智能转录工具展现出惊人速度与精准度,其处理效率通常达到OpenAI同类产品的两倍。这再次印证了苹果“后来居上”的产品哲学——自OpenAI于2022年9月推出Whisper转录技术以来,该方案虽已成为数十款应用的标准配置,但这一格局或将因苹果的入局而改变。

Cover Image

在2025年全球开发者大会(WWDC)期间,苹果宣布向第三方开发者开放其智能工具套件。尽管官方披露细节有限,也未重点推介转录功能,开发者们已开始发掘这些工具的潜力。据MacStories撰稿人约翰·沃希斯(John Voorhees)透露,他与儿子仅用约十分钟就构建出名为Yap的命令行工具,成功调用苹果macOS Tahoe和iOS 26测试版中发布的SpeechAnalyzer与SpeechTranscriber语音框架组件,目前该工具已在GitHub开源,需开发者账户及macOS Tahoe系统支持。

由于AI转录工具性能主要取决于底层大语言模型(LLM),直接对比存在难度。但实测数据显示:在处理同一段7GB的4K视频文件时,苹果智能工具仅用45秒完成字幕转录,而采用Large V3 Turbo模型的MacWhisper耗时1分41秒,其Large C2模型更需要3分55秒。虽然所有转录结果均需人工校对,但苹果方案在保持与Whisper相当准确度的同时,速度优势显著。

除向开发者开放工具外,苹果还发布了详细的技术实现视频教程。值得注意的是,这套技术已深度整合至macOS 26、iOS 26等测试版系统中,为信息(iMessage)和通话的实时翻译功能提供核心支持。


文章标签: #苹果 #OpenAI #转录 #AI #开发者

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。