苹果公司原计划在上个月随iOS 18.4系统更新推出备受期待的“个性化Siri”功能,但随后确认这项新功能将推迟至明年发布。最新报道披露了苹果如何参照“Apple Intelligence”(苹果智能)框架来训练其人工智能模型的具体细节。

Cover Image

尽管苹果官方声明将个性化Siri功能推迟至明年,但内部员工越来越确信该功能有望在今年晚些时候准备就绪。彭博社最新报道重点介绍了苹果训练AI模型的技术路径。报道援引苹果机器学习研究网站的博文内容,详细阐述了如何利用合成数据训练AI模型。

此前多次报道提到,苹果在AI竞赛中落后于竞争对手,其采用合成数据训练AI模型的策略较为特殊且存在局限性。特别是在需要处理长句或完整邮件的摘要生成、写作工具等场景时,这类数据难以有效“理解趋势”。

苹果注意到这一问题,并提出通过将合成数据与用户近期邮件样本进行对比的新技术来突破限制,同时确保用户隐私不受侵害。具体实现流程包括:

  1. 模型优化需要生成覆盖常见邮件主题的合成邮件数据集。首先创建涵盖各类主题的合成信息,例如“明天上午11:30想打网球吗?”,整个过程完全不涉及任何真实用户邮件内容。

  2. 为每条合成信息生成称为“嵌入向量”的数字表征,捕捉语言特征、主题和长度等关键维度。这些向量会被传送至少数选择参与设备分析的用户终端。

  3. 参与设备会选取少量近期用户邮件样本计算其嵌入向量,通过差分隐私技术比对与合成向量的相似度。苹果可据此获知最常被选中的合成向量,但无法追踪具体设备的匹配情况。

  4. 高频匹配的合成向量可用于生成训练数据集。例如若“网球邀约”成为高频向量,系统会自动生成将“网球”替换为“足球”等运动的变体文本,用于下一轮数据优化。该流程既能提升合成邮件的主题相关性和语言质量,助力模型生成更优质的邮件摘要等文本输出,又全程保障用户隐私。

苹果承认现有技术存在局限,但强调新技术可在不收集用户信息的前提下更好地把握整体趋势。彭博社透露,这项技术将随iOS 18.5和macOS 15.5测试版系统发布。


文章标签: #苹果 #AI训练 #隐私保护 #嵌入向量 #差分隐私

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。