壁仞推出全球最大算力芯片,号称以 7nm 超越英伟达 4nm 最新 GPU
以下文章来源于 mp.weixin.qq.com 业界给壁仞创办人张文很多称号:“中国第一大猎头”(找了英伟达、海思、高通、AMD 等高手加入)、“融资机器”(累积募资 47 亿人民币)。
业界给壁仞创办人张文很多称号:“中国第一大猎头”(找了英伟达、海思、高通、AMD 等高手加入)、“融资机器”(累积募资 47 亿人民币)。这些称号的背后,更代表数以千计双眼睛在盯着看:花了三年时间的壁仞究竟会端出什么样的菜色?在 8 月 9 日的发布会上,壁仞给出答案。
壁仞在发布会上表示,正式发布首款通用 GPU 芯片 BR100,采用 7nm 工艺技术,号称世界上最大算力芯片,16 位浮点算力达到 1000T 以上、8 位定点算力达到 2000T 以上,单芯片峰值算力达到 PFLOPS 级别。
同时,壁仞也为这次的 BR100 发布会下了一个注解:标志中国企业第一次打破了此前一直由国际巨头保持的通用 GPU 全球算力纪录,中国的通用 GPU 芯片正式迈入 “每秒千万亿次计算” 新时代。
在发布会上,壁仞公布在四个峰值算力对比上,BR100 都胜过国际厂商的最新旗舰产品,要用 7nm 工艺就能打造出超过国际巨头的 4nm 工艺产品。
壁仞的 BR100 对标的是英伟达采用 4nm 工艺技术打造的 H100。英伟达的 GPU 之所以能制霸全球,强大的的 CUDA 生态系统绝对是重要关键。壁仞认为,初期要能做到兼容主流生态。张文进一步表示,首款通用 GPU 芯片产品——BR100 创出全球算力纪录,峰值算力达到国际厂商在售旗舰产品 3 倍以上,创下国内互连带宽纪录,还是国内率先采用 Chiplet 技术、率先采用新一代主机接口 PCIe 5.0、率先支持 CXL 互连协议的通用 GPU 芯片。他也强调指出,BR100 能实现领先算力的关键,是最底层自主原创的芯片架构。对于 BR100 的诞生,张文以 “几十个人常常好几个月都睡在办公室,生活就是为了创造芯片。” 来形容这一段岁月。除了 BR100 通用 GPU 芯片之外,壁仞同时也发布了自主原创架构——壁立仞创造的 OAM 服务器——海玄,以及 OAM 模组——壁砺 100、PCIe 板卡产品——壁砺 104,以及自主研发的 BIRENSUPA 软件平台。
在发布会上,壁仞科技联合创始人、CTO 洪洲,详细介绍了原创架构——壁立仞。洪洲说,壁立仞架构以数据流为中心,对数据流进行深度的优化,通过六大技术特性,比较完整地解决了数据搬移的瓶颈和并行度不足的问题,使得 BR100 芯片在给定的工艺下实现了性能和能效的跨越式进步。
另外,洪洲也介绍 BR100 采用了 Chiplet 设计理念,让芯片总面积可以突破光罩尺寸对单芯片面积的限制,集成更多的算力和通用性逻辑。此外,通过缩小单个计算芯粒的面积,可同时提升产能与良率,进而极大地降低硅片的成本,支持更灵活的产品策略。在发布会上,也介绍了 BR100 系列的另一款产品 BR104。壁仞号称,该款芯片同样基于壁立仞架构,拥有 1 个计算芯粒,性能约为 BR100 的一半,超越了国际厂商的在售旗舰产品。洪洲指出,“Chiplet 设计让我们可以通过一次流片,同时得到两种芯片,加快了迭代速度,同时覆盖不同层级的市场。”