谷歌在上周五为旗下 Gemini 开发者 API 添加了一个新的实验性文本“嵌入”模型——Gemini 嵌入(Gemini Embedding)。简单来说,嵌入模型的作用是将文本输入,比如单词和短语,转化为数值化的嵌入形式。这些嵌入能够精准捕捉文本的语义含义,因此被广泛应用于文档检索和分类等场景。它的一大优势在于可以降低使用成本,同时提高处理速度。
目前,包括亚马逊、Cohere 和 OpenAI 在内的多家科技公司都通过各自的 API 提供类似的嵌入模型。谷歌此前也有过相关产品,但此次推出的 Gemini 嵌入是其首个基于 Gemini AI 模型家族训练的嵌入模型。
谷歌在其博客文章中提到:“Gemini 嵌入继承了 Gemini 模型对语言和语境的深度理解,能够广泛应用于多种场景。”该公司还强调,他们对这一模型进行了高度通用化的训练,使其在金融、科学、法律、搜索等多个领域都能表现出色。
谷歌声称,Gemini 嵌入的性能超越了其此前最先进的嵌入模型 text-embedding-004,并在流行的嵌入基准测试中取得了优异成绩。与 text-embedding-004 相比,Gemini 嵌入能够一次性处理更长的文本和代码,并且支持的语言数量是前者的两倍,超过 100 种。
不过,谷歌也提醒用户,Gemini 嵌入目前仍处于“实验阶段”,容量有限且可能会根据反馈进行调整。公司表示:“我们正在努力使其在未来几个月内实现稳定且广泛可用的发布。”