5月11日消息,随着AI需求转向推理时代,算力不再是主要瓶颈,内存墙的问题愈发严重,高带宽低延迟的内存架构成为挑战,现在国内公司也通过架构创新实现了飞跃。
日前新紫光集团宣布推出“紫弦”三维化近存计算(PNM)架构,以3D DRAM为核心,首创3.5D异质异构集成方案,存储带宽可达30TB/s。
这是什么概念呢,目前AMD及NVIDIA再用的HBM3e显存单个带宽也就1.2TB/s,B200显卡带宽也就做到了8TB/s,紫弦的30TB/s带宽可以说碾压性领先。
不仅如此,该架构的延迟也非常低,PNM近存计算模式下访存延迟最大降低18倍。
与NVIDIA的B200显卡相比,模拟仿真显示同等算力下Token吞吐率较B200系列高出1.5至2倍以上。
这次发布的技术也不只是纸上谈兵,新紫光强调该技术可规模化量产,更重要的一点是不会被国外技术限制,它是基于国内领先供应链做的可规模化量产。
不过该技术具体什么时候量产上市还没消息,只能说国产的AI系统完全可以在先进制程受限制的情况下,通过架构和技术创新走一条不同的路。
文章来源:
我爱百科网
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至23467321@qq.com举报,一经查实,本站将立刻删除;如已特别标注为本站原创文章的,转载时请以链接形式注明文章出处,谢谢!