威刚(ADATA)旗下的品牌TRUSTA推出了一种面向AI推理的新型内存解决方案,该方案通过利用系统内存和固态硬盘(SSD)等存储设备,打破了GPU的显存限制。

GPU显存不足?TRUSTA这套新方案能解决AI瓶颈
AI推理与具身AI工作流的兴起,已给科技行业带来了巨大冲击。需求暴增,而供应却严重不足。AI公司对GPU等加速器上的内存需求日益增长,同时近期的CPU热潮也使得系统内存需求大幅提升。在此背景下,威刚的姊妹品牌TRUSTA发布了一款名为“AI标量扩展内存”的新解决方案,它将系统中所有可用的内存与SSD等存储解决方案相结合,并可用于模型的部署,有望解决日益增长的内存瓶颈问题。
根据新闻稿:内存领导者威刚科技的企业级存储品牌TRUSTA,今日正式推出TRUSTA AI Scaler扩展内存解决方案。作为行业先驱,TRUSTA将AI Scaler工具包作为该解决方案的核心,将AI模型的部署范围从仅限GPU的架构,扩展到了系统内存和高速SSD。这套软硬件一体化解决方案,能帮助企业克服GPU内存限制,并在模型推理和微调场景中,将AI部署成本降低超过50%。此次发布也标志着威刚从一家内存与存储品牌,向软硬件一体化解决方案提供商的转型,进一步巩固了其为全球企业构建更高效、可扩展、更灵活的本地AI基础设施的承诺。
重新定义内存层级,推动AI普及,部署成本直降超50%
研究机构预测,到2034年,AI基础设施的年复合增长率约为26%,同时越来越多的AI部署正从云服务转向企业自建和边缘部署的新阶段。随着各组织构建AI基础设施,数据隐私、法规遵从、成本可控性和数据引力等因素,促使TRUSTA引入了一个新理念:如何在本地的GPU、DRAM和SSD之间,建立一种更经济且可扩展的内存配置。
如今运行大型语言模型通常需要高端GPU,这造成了高昂的部署门槛和有限的扩展性。TRUSTA AI Scaler扩展内存存储解决方案正是为了应对这一市场挑战而设计的。与完全依赖GPU内存的架构相比,AI Scaler工具包将模型部署扩展到GPU内存、DRAM和SSD,从而能更高效地利用系统资源。在测试场景中,通常需要多个GPU的模型推理,可以被优化到在单个GPU配合扩展系统内存上运行。对于模型微调,该方案还可以在GPU、DRAM和SSD之间动态分配计算资源,实现更灵活的资源扩展,从而将部署成本降低超过50%,帮助企业在有限的预算内评估AI落地。
Computex获奖创新,支持主流模型,加速AI代理集成
AI Scaler工具包被设计为一个免费且开源的平台,不绑定特定的硬件配置,使企业、研究机构和开发者可以根据自身需求配置资源。该平台支持主流的模型系列,包括Llama、Qwen、Mistral、Mixtral、GPT-OSS、DeepSeek、Phi和Gemma,并且对其他模型的支持也在持续扩展。它还支持OpenClaw、NemoClaw和Hermes Agentic等AI代理应用,帮助用户将AI Scaler集成到更完整的具身AI工作流中。AI Scaler工具包现已完全开放下载和使用。
TRUSTA还将在Computex展会上展示其最新的TD7P51 ECO PCIe Gen5企业级SSD,提供高达15.36TB的容量,并支持U.2、E1.S和E3.S等多种外形规格。该SSD还采用了灵活数据放置(FDP)等技术,通过智能数据放置增强了可靠性和稳定性。TRUSTA产品已通过多个全球领先服务器平台的验证,进一步巩固了该品牌在AI、云和数据中心应用领域的存储产品线。



