国产芯片新突破!棣山科技晒自研2nm高端AI GPU:兼容英伟达CUDA

趣百科 新闻资讯 1

4月14日消息,近日,上海棣山科技对外披露其2nm高端AI GPU芯片最新研发进展。

据悉,该公司自主攻关的这款芯片已达到国际前沿设计水平,目前核心研发工作仍处于原型验证关键阶段。

该款2nm AI GPU原型芯片采用FinFET/GAA混合制程与Chiplet异构集成架构,搭载公司自主研发的“棣山智核(DS- Core)”,核心晶体管数量达1700亿颗,采用2.5D CoWoS-L先进封装技术。

性能表现上,这款芯片FP32单精度算力可达50 TFLOPS,FP16半精度算力达100 TFLOPS,FP4低精度算力高达400 TFLOPS,可灵活适配不同精度需求的人工智能大模型训练、推理等高端算力场景;能效比较上一代产品提升40%,典型功耗控制在350W以内,每瓦算力可达142 GFLOPS。

同时,研发团队成功攻克高带宽内存(HBM)封装互联、超低延迟片间通信(<0.25ns/mm)、微流道高效热管理三大核心技术瓶颈,其中搭载的HBM4内存单颗容量达48GB,引脚速率超11Gb/s,内存带宽可达3.2TB/s,相较上一代HBM3E带宽提升约2.5倍,可满足大模型训练时海量数据的高速传输需求;微流道热管理技术可使芯片热失控风险降低68%,芯片工作温度稳定控制在85℃以下。

此外,该芯片支持NVLink 6兼容互连协议,单链路带宽达1.6TB/s,多芯片互联时可实现无瓶颈协同运算,进一步提升整体算力规模,同时兼容主流CUDA软件生态,可大幅降低下游客户技术迁移成本。