TRUSTA推出AI标量扩展内存，用DRAM和SSD打破GPU显存瓶颈，部署成本直降超50%

威刚（ADATA）旗下的品牌TRUSTA推出了一种面向AI推理的新型内存解决方案，该方案通过利用系统内存和固态硬盘（SSD）等存储设备，打破了GPU的显存限制。

GPU显存不足？TRUSTA这套新方案能解决AI瓶颈

AI推理与具身AI工作流的兴起，已给科技行业带来了巨大冲击。需求暴增，而供应却严重不足。AI公司对GPU等加速器上的内存需求日益增长，同时近期的CPU热潮也使得系统内存需求大幅提升。在此背景下，威刚的姊妹品牌TRUSTA发布了一款名为“AI标量扩展内存”的新解决方案，它将系统中所有可用的内存与SSD等存储解决方案相结合，并可用于模型的部署，有望解决日益增长的内存瓶颈问题。

根据新闻稿：内存领导者威刚科技的企业级存储品牌TRUSTA，今日正式推出TRUSTA AI Scaler扩展内存解决方案。作为行业先驱，TRUSTA将AI Scaler工具包作为该解决方案的核心，将AI模型的部署范围从仅限GPU的架构，扩展到了系统内存和高速SSD。这套软硬件一体化解决方案，能帮助企业克服GPU内存限制，并在模型推理和微调场景中，将AI部署成本降低超过50%。此次发布也标志着威刚从一家内存与存储品牌，向软硬件一体化解决方案提供商的转型，进一步巩固了其为全球企业构建更高效、可扩展、更灵活的本地AI基础设施的承诺。

重新定义内存层级，推动AI普及，部署成本直降超50%

研究机构预测，到2034年，AI基础设施的年复合增长率约为26%，同时越来越多的AI部署正从云服务转向企业自建和边缘部署的新阶段。随着各组织构建AI基础设施，数据隐私、法规遵从、成本可控性和数据引力等因素，促使TRUSTA引入了一个新理念：如何在本地的GPU、DRAM和SSD之间，建立一种更经济且可扩展的内存配置。

如今运行大型语言模型通常需要高端GPU，这造成了高昂的部署门槛和有限的扩展性。TRUSTA AI Scaler扩展内存存储解决方案正是为了应对这一市场挑战而设计的。与完全依赖GPU内存的架构相比，AI Scaler工具包将模型部署扩展到GPU内存、DRAM和SSD，从而能更高效地利用系统资源。在测试场景中，通常需要多个GPU的模型推理，可以被优化到在单个GPU配合扩展系统内存上运行。对于模型微调，该方案还可以在GPU、DRAM和SSD之间动态分配计算资源，实现更灵活的资源扩展，从而将部署成本降低超过50%，帮助企业在有限的预算内评估AI落地。

Computex获奖创新，支持主流模型，加速AI代理集成

AI Scaler工具包被设计为一个免费且开源的平台，不绑定特定的硬件配置，使企业、研究机构和开发者可以根据自身需求配置资源。该平台支持主流的模型系列，包括Llama、Qwen、Mistral、Mixtral、GPT-OSS、DeepSeek、Phi和Gemma，并且对其他模型的支持也在持续扩展。它还支持OpenClaw、NemoClaw和Hermes Agentic等AI代理应用，帮助用户将AI Scaler集成到更完整的具身AI工作流中。AI Scaler工具包现已完全开放下载和使用。

TRUSTA还将在Computex展会上展示其最新的TD7P51 ECO PCIe Gen5企业级SSD，提供高达15.36TB的容量，并支持U.2、E1.S和E3.S等多种外形规格。该SSD还采用了灵活数据放置（FDP）等技术，通过智能数据放置增强了可靠性和稳定性。TRUSTA产品已通过多个全球领先服务器平台的验证，进一步巩固了该品牌在AI、云和数据中心应用领域的存储产品线。

搜索结果如下

阅读全文

TRUSTA推出AI标量扩展内存，用DRAM和SSD打破GPU显存瓶颈，部署成本直降超50%

GPU显存不足？TRUSTA这套新方案能解决AI瓶颈

重新定义内存层级，推动AI普及，部署成本直降超50%

Computex获奖创新，支持主流模型，加速AI代理集成

也可以看看

微软取消重磅续作，黑曜石全力打造新《辐射》游戏

阅读全文

罗素兄弟正式重启《威鲸闯天关》，经典家庭冒险IP再启航

阅读全文

AMD确认Zen 6架构EPYC Venice处理器将于7月22至23日发布

阅读全文