最近,中国人工智能实验室DeepSeek在华尔街引起了广泛关注。据称,DeepSeek的人工智能模型在上周的表现让市场为之震动。其核心优势在于能够显著降低开发成本,同时使用英伟达公司(NVIDIA Corporation)的GPU。这一举措让投资者开始重新思考:在人工智能开发领域,是否真的需要投入巨额资金用于硬件采购?

DeepSeek-and-Apple-Intelligence

DeepSeek的技术亮点在于其对一种低级编程语言——并行线程执行(Parallel Thread Execution,PTX)的深度应用。与英伟达常用的计算统一设备架构(Compute Unified Device Architecture,CUDA)不同,PTX能够让工程师更深入地控制GPU的基本功能。这种技术的优势在于能够从性能较低的硬件中挖掘出更高的效率,而掌握PTX的工程师相对较少,这也使得DeepSeek的技术更具独特性。

据香港媒体报道,DeepSeek未来可能会更多地依赖国内的中国GPU。这一转变的背后原因在于美国对GPU的出口限制。由于制裁,DeepSeek只能获取有限数量或性能较低的英伟达GPU。然而,其在PTX方面的深厚技术积累,使其有可能通过优化编程,从国内的GPU中获取更高的性能。

中国的半导体制造业一直受到美国制裁的冲击。中芯国际(Semiconductor Manufacturing International Corporation,SMIC)作为中国最大的芯片代工厂,被限制获取荷兰ASML公司的先进芯片制造设备。这些设备是制造最先进芯片的关键,而中芯国际目前只能使用较旧的7纳米工艺技术来生产芯片。

DeepSeek声称其使用的英伟达Hopper H800 GPU采用了5纳米制造工艺,这是2023年行业中最先进的技术。然而,中国的GPU目前可能仍停留在较旧的制造工艺阶段,性能上与英伟达最新的Blackwell GPU存在较大差距。但DeepSeek的技术团队通过对PTX的深入理解和应用,有望弥补这一差距。

总的来说,DeepSeek的技术突破不仅展示了其在人工智能领域的创新能力,也为国内半导体产业的发展提供了新的思路。未来,随着国内GPU技术的不断进步,DeepSeek或许能够进一步降低对进口芯片的依赖,推动中国人工智能产业的自主发展。


文章标签: #人工智能 #半导体 #GPU #国产芯片 #技术突破

负责编辑

  菠萝老师先生 

  让你的每一个瞬间都充满意义地生活,因为在生命的尽头,衡量的不是你活了多少年,而是你如何度过这些年。