深度学习是人工智能产业背后的强大引擎,它让人工智能能够自主学习,其驱动力来自于专为大规模运行机器学习算法而设计的图形处理器(GPU)。然而,深度学习的发明最初所基于的硬件,并非专门为此类计算而设计。英伟达(Nvidia)首席执行官黄仁勋(Jensen Huang)《乔·罗根播客》(Joe Rogan Experience)中透露,最早开发深度学习的研究人员在2012年仅使用了一对以SLI方式连接的3GB显存GTX 580显卡就完成了这一切。

Cover Image

多伦多大学的研究人员发明深度学习,旨在改进计算机视觉中的图像检测。2011年,亚历克斯·克里泽夫斯基(Alex Krizhevsky)伊利亚·苏茨克韦尔(Ilya Sutskever)杰弗里·辛顿(Geoffrey Hinton)正在研究构建图像识别工具的更好方法。当时,神经网络的概念尚未普及,开发者们使用的是手动设计的算法来检测边缘、角落和纹理以实现图像识别。

这三位研究人员构建了AlexNet架构,它包含八层,总计约6000万个参数。该架构之所以如此特别,在于其结合了卷积层和深度神经网络层,从而具备了自主学习的能力。这个架构非常出色,在其首次问世时,其性能就超越了当时领先的图像识别算法超过70%,立即引起了整个行业的关注。

黄仁勋透露,AlexNet的开发者在SLI模式下的一对GTX 580显卡上构建了他们的图像识别算法。此外,该网络经过优化,可在两块GPU上同时运行,并且两块GPU仅在需要时交换数据,从而显著缩短了训练时间。这使得GTX 580成为世界上第一款运行深度学习/机器学习人工智能网络的显卡。

颇具讽刺意味的是,这一里程碑是在英伟达对人工智能投资甚微的时期实现的。当时,该公司大部分的图形研发都专注于3D图形、游戏以及CUDA技术。GTX 580是专为游戏设计的,对加速深度学习网络并无高级支持。事实证明,GPU固有的并行性恰恰是神经网络实现高速运行所需要的。

黄仁勋进一步透露,正是AlexNet及其在GTX 580上的应用,促使英伟达开始投身于人工智能硬件的开发。他表示,一旦公司意识到深度学习可用于解决世界性问题,便在2012年将所有资金、开发和研究都投入到了深度学习技术上。这催生了2016年问世的初代英伟达DGX系统(该系统被交付给埃隆·马斯克(Elon Musk))、搭载第一代Tensor核心的Volta架构以及DLSS技术。如果不是因为那一对运行着AlexNetGTX 580显卡,英伟达或许不会成为今天的人工智能巨头。


文章标签: #深度学习 #英伟达 #黄仁勋 #AlexNet #GPU

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。