谷歌在上周五为旗下 Gemini 开发者 API 添加了一个新的实验性文本“嵌入”模型——Gemini 嵌入(Gemini Embedding)。简单来说,嵌入模型的作用是将文本输入,比如单词和短语,转化为数值化的嵌入形式。这些嵌入能够精准捕捉文本的语义含义,因此被广泛应用于文档检索和分类等场景。它的一大优势在于可以降低使用成本,同时提高处理速度。

Cover Image

目前,包括亚马逊、Cohere 和 OpenAI 在内的多家科技公司都通过各自的 API 提供类似的嵌入模型。谷歌此前也有过相关产品,但此次推出的 Gemini 嵌入是其首个基于 Gemini AI 模型家族训练的嵌入模型。

谷歌在其博客文章中提到:“Gemini 嵌入继承了 Gemini 模型对语言和语境的深度理解,能够广泛应用于多种场景。”该公司还强调,他们对这一模型进行了高度通用化的训练,使其在金融、科学、法律、搜索等多个领域都能表现出色。

谷歌声称,Gemini 嵌入的性能超越了其此前最先进的嵌入模型 text-embedding-004,并在流行的嵌入基准测试中取得了优异成绩。与 text-embedding-004 相比,Gemini 嵌入能够一次性处理更长的文本和代码,并且支持的语言数量是前者的两倍,超过 100 种。

不过,谷歌也提醒用户,Gemini 嵌入目前仍处于“实验阶段”,容量有限且可能会根据反馈进行调整。公司表示:“我们正在努力使其在未来几个月内实现稳定且广泛可用的发布。”


文章标签: #谷歌 #Gemini #文本嵌入 #人工智能 #模型

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。