在人工智能(尤其是通知摘要等功能)表现欠佳引发批评后,苹果公司于本周一披露了如何通过结合合成数据与隐私化用户数据分析来提升其AI模型。该公司采用名为“差分隐私”的技术方案:首先生成模拟用户数据格式与关键特征的合成数据,随后向同意共享设备分析数据的用户设备发送数据片段,通过比对结果优化模型精度。
苹果在技术博客中说明:“合成数据旨在模拟用户数据的格式与核心特征,但不包含任何真实用户内容。为构建具有代表性的合成邮件库,我们先批量生成涵盖多主题的模拟邮件……随后提取能反映语言特征、主题和长度等关键维度的向量表征(即嵌入值)。”
这些数据向量将被发送至少量开启设备分析功能的用户终端,设备通过比对本机邮件样本反馈最匹配的向量数据。苹果表示正将此技术应用于Genmoji(生成式表情)模型优化,未来还将拓展至Image Playground(图像游乐场)、Image Wand(图像魔杖)、Memories Creation(回忆创作)、Writing Tools(写作工具)及Visual Intelligence(视觉智能)等功能模块。针对邮件摘要功能,苹果也将通过合成数据向参与设备分析计划的用户征询优化建议。