人工智能是一个复杂且充满挑战的领域。在这个领域里,科学家们常常会用到一些专业术语来解释他们的研究成果。因此,我们在报道人工智能行业时,也不得不频繁地使用这些技术性词汇。为了让读者更好地理解这些内容,我们觉得有必要整理一份包含我们在文章中使用的一些最重要的词汇和短语的术语表。

Cover Image

我们会定期更新这份术语表。随着研究人员不断探索新方法以推动人工智能的前沿发展,并识别新兴的安全风险,我们会相应地增加新的词条。

人工智能代理(AI agent)

人工智能代理是一种工具,它利用人工智能技术为您执行一系列任务,这些任务超出了基础人工智能聊天机器人所能完成的范围。例如,它可以帮您填写费用报销单、预订机票或餐厅座位,甚至编写和维护代码。不过,正如我们之前解释的那样,这一新兴领域中有许多变量,因此不同的人在提到人工智能代理时可能有不同的理解。相关基础设施仍在建设中,以实现预期的功能。但它的基本概念是一种自主系统,可能会调用多个人工智能系统来执行多步骤任务。

思维链(Chain of thought)

对于一个简单的问题,人类大脑可以不假思索地回答,比如“长颈鹿和猫之间哪个动物更高?”但在许多情况下,你往往需要纸和笔才能得出正确答案,因为存在中间步骤。例如,如果一个农民有鸡和牛,它们总共有40个头和120条腿,你可能需要写下简单的方程式来得出答案(20只鸡和20头牛)。

在人工智能领域,大型语言模型的思维链推理意味着将问题分解为更小的中间步骤,以提高最终结果的质量。这种方法通常需要更长时间才能得出答案,但答案更有可能是正确的,特别是在逻辑或编程的上下文中。所谓的推理模型是从传统大型语言模型发展而来的,并通过强化学习优化了思维链推理能力。

(参见:大型语言模型)

深度学习(Deep learning)

深度学习是自我改进型机器学习的一个分支,其中人工智能算法采用多层人工神经网络(ANN)结构设计。这使得它们能够比简单的基于机器学习的系统(如线性模型或决策树)建立更复杂的关联。深度学习算法的结构灵感来源于人脑中神经元的相互连接路径。

深度学习人工智能能够自行识别数据中的重要特征,而无需人类工程师定义这些特征。这种结构还支持能够从错误中学习的算法,并通过重复和调整的过程改进自身的输出。然而,深度学习系统需要大量的数据点才能产生良好的结果(数百万甚至更多)。与简单的机器学习算法相比,深度学习系统的训练时间通常更长,因此开发成本也更高。

(参见:神经网络)

微调(Fine tuning)

微调是指对人工智能模型进行进一步训练,以优化其在比之前训练重点更具体的任务或领域的表现——通常通过输入新的、专门的(即任务导向的)数据来实现。许多人工智能初创公司以大型语言模型为起点构建商业产品,但通过基于自身特定领域的知识和专长进行微调,以增强其在目标领域或任务中的实用性。

(参见:大型语言模型(LLM))

大型语言模型(LLM)

大型语言模型(LLM)是流行的人工智能助手所使用的模型,例如ChatGPT、Claude、谷歌的Gemini、Meta的AI Llama、微软的Copilot或Mistral的Le Chat。当你与人工智能助手聊天时,你直接与大型语言模型互动,或者借助不同的可用工具(如网络浏览或代码解释器)来处理你的请求。

人工智能助手和LLM可以有不同的名称。例如,GPT是OpenAI的大型语言模型,而ChatGPT是人工智能助手产品。

LLM是由数十亿数值参数(或权重,见下文)构成的深度神经网络,这些参数学习单词和短语之间的关系,并创建语言的表示形式,即一种多维的词汇地图。这些模型是通过对数十亿书籍、文章和转录文本中发现的模式进行编码而创建的。当你提示一个LLM时,模型会生成最符合提示的最可能的模式。然后,它根据之前的内容评估最后一个词之后最可能的下一个词。重复,再重复,不断重复。

(参见:神经网络)

神经网络(Neural network)

神经网络是指支撑深度学习的多层算法结构——更广泛地说,是随着大型语言模型的出现而引发的整个生成式人工智能工具的繁荣。尽管从20世纪40年代开始就有人提出从人脑密集的相互连接路径中汲取灵感,将其作为数据处理算法的设计结构,但正是近年来图形处理硬件(GPU)的兴起——通过视频游戏行业——真正释放了这一理论的潜力。这些芯片非常适合训练比早期时代更多层的算法,从而使基于神经网络的人工智能系统在许多领域实现了更好的性能,无论是语音识别、自主导航还是药物发现。

(参见:大型语言模型(LLM))

权重(Weights)

权重是人工智能训练的核心,因为它们决定了在用于训练系统的数据中,不同特征(或输入变量)被赋予的重要性(或权重),从而塑造人工智能模型的输出。换句话说,权重是定义数据集中与给定训练任务最相关的内容的数值参数。它们通过将输入值相乘来实现其功能。模型训练通常从随机分配的权重开始,但随着训练过程的推进,权重会根据模型试图更接近目标输出而进行调整。

例如,一个基于目标地区的历史房地产数据训练的用于预测房价的人工智能模型可能会包含权重特征,如卧室和浴室的数量、房屋是否为独立屋、半独立屋、是否有停车位、车库等。最终,模型为每个输入赋予的权重反映了这些因素对房产价值的影响程度,基于给定的数据集。


文章标签: #人工智能 #深度学习 #大型语言模型 #神经网络 #微调

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。