卡普空新作生化危机生存小队,登陆移动平台
阅读全文

锤刻创思寰宇网
据Phoronix报道,去年险些关停的CUDA兼容层项目ZLUDA在获得神秘资方支持后,本周公布了技术进展与团队扩充情况。该项目持续致力于在非英伟达GPU上运行CUDA工作负载,当前重点聚焦AI领域而非其他应用,同时已启动32位PhysX物理引擎的兼容性开发以满足老款CUDA游戏需求。
该项目最显著的进展是开发团队从1人扩充至2名全职成员。新成员Violet加入不足一月,已通过llm.c项目推动大语言模型(LLM)工作负载支持取得重要突破。
社区贡献者@Groowy通过收集详细CUDA日志启动了32位PhysX支持工作,期间发现的若干漏洞同时影响64位CUDA功能,修复方案已被纳入官方路线图。但完全实现32位支持仍需开源社区持续助力。
团队正在通过微型测试项目llm.c验证GPT-2模型的CUDA运行能力。这个调用8,186次CUDA函数(涉及44种API)的测试程序,初期在首个调用就会崩溃,经Violet优化后现可持续运行至第552次调用。目前已完成16个关键函数的支持开发,为未来兼容PyTorch等大型框架奠定基础。
项目核心目标是在非英伟达硬件上精确模拟CUDA行为,要求指令输出与原生硬件保持位级一致或严格容差。新版ZLUDA采用创新的PTX“扫描”测试——通过系统化验证NVIDIA中间语言所有指令组合的输出准确性,修复了此前版本存在的精度妥协问题,现已确认包括cvt在内复杂指令的位级精确性。
新版日志系统可捕获更全面的运行时行为,包括cuBLAS调用cuBLASLt的细节及cuDNN与底层驱动API的交互过程,为游戏/3D应用/机器学习框架的兼容性调试提供关键支持。
针对AMDROCm/HIP 6.4版本的ABI变更(动作编号重组为v3标准),团队解决了由此引发的错误调用问题。特别是在Windows平台,其声称采用2.9版本却内部混用v3 ABI的行为已获修正。