谷歌旗下的“开源”AI模型家族Gemma正在持续壮大。在周二举行的2025年谷歌I/O开发者大会上,谷歌揭晓了专为手机、笔记本电脑和平板电脑“流畅运行”而设计的Gemma 3n模型。据谷歌介绍,这款即日起开放预览的模型能够处理音频、文本、图像和视频等多种数据类型。

Cover Image

近年来,能够在离线状态下运行且无需依赖云端计算的轻量化AI模型在业界持续升温。这类模型不仅使用成本低于大型模型,更能通过避免将数据传输至远程数据中心来保障用户隐私。

谷歌Gemma产品经理格斯·马丁斯(Gus Martins)在主题演讲中透露,Gemma 3n可在内存不足2GB的设备上流畅运行。“Gemma 3n与Gemini Nano采用相同架构,经过精心设计能提供卓越性能,”他补充道。

除Gemma 3n外,谷歌还通过健康AI开发者基础计划推出了MedGemma。官方称这是目前最强大的开源模型,专门用于分析与健康相关的文本和图像资料。“MedGemma是我们推出的多模态健康文本图像理解开源模型系列,”马丁斯表示,“该模型在各类图像文本应用中表现优异,开发者可据此构建专属健康应用。”

即将面世的SignGemma则是一款将手语转化为口语文本的开源模型。谷歌表示,该模型将助力开发者为听障群体打造创新应用与服务。“SignGemma是专门训练用于手语转译的新模型系列,目前对美国手语和英语的识别最为精准,”马丁斯介绍道,“这是迄今最强大的手语理解模型,我们期待开发者与听障社群能基于此开创更多应用。”

值得注意的是,Gemma系列因其自定义的非标准许可条款引发争议,部分开发者认为商业使用存在法律风险。不过这并未阻碍该系列模型下载量累计突破数千万次。


文章标签: #AI模型 #谷歌 #医疗AI #手语识别 #开源

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。