中国初创企业比伦科技在GPU市场与NVIDIA展开较量
在Hot Chips 34,一个新玩家进入了高性能GPU市场。2022年8月31日,杰克·赫兹
几年来,GPU市场主要由两个关键玩家主导:AMD和NVIDIA。然而,像英特尔这样的其他公司也在迎头赶上。上周,一个全新的竞争对手进入了GPU市场的Hot Chips 34。
Biren说,BR100可容纳770亿个晶体管。比伦科技的图像应用
中国初创公司比伦科技在会议上摆脱了隐形模式,宣布发布其BR100 GPU。在这篇文章中,我们将看看Biren,它的第一款GPU产品,以及它与其他顶级GPU的对比。
Biren公司BR100的GPU设计
基于台积电的7nm工艺,BR100 GPU集成了几种现代架构布局,这表明GPU可能是AMD和NVIDIA产品的强大对手。与业内许多最新的旗舰产品类似,如Apple M1 Ultra和NVIDIA Grace CPU,BR100采用了双芯片设计。BR100由两个单独的小芯片组成,每个小芯片托管16个流式处理器集群(SPC)和为流式应用程序优化的计算块。
在SPC中,每个SPC的16个执行单元(EU)被分成四组,每组四个EU。在更低的级别上,每个执行单元由16个流处理器内核组成,Biren称之为V-Core,以及一个Tensor引擎,称之为T-Core。每个EU集群共享64kB的一级缓存,而每个SPC共享8MB的二级缓存。
BR100体系结构图。图片由比伦科技提供
然后,这两个管芯通过专有的管芯到管芯互连相互连接,该互连以96GB/s的带宽进行时钟输入。BR100总共占据了1074毫米的面积2.拥有超过770亿个晶体管。Biren设计了BR100 GPU,以提供大量并行性,从而优化数据中心的人工智能训练和推理。
BR100性能
根据Biren的说法,BR100可以在人工智能推理和训练方面与一些更大的竞争对手保持同步,在INT8达到2048个TOPS,在BF16达到1024个TFLOPS,在TF32+达到512个TFLOPS,在FP32达到256个TFLOPS的峰值性能。为了在额定1GHz时钟频率下达到这些指标,BR100具有550W的最大热设计功率(TDP)。
Biren BR100和其他旗舰GPU的计算性能比较。图片由比伦科技提供
在基准测试报告中,比伦将其BR100与NVIDIA的Ampere A100 GPU进行了比较,比伦声称在某些人工智能推理和训练过程中具有2.6倍的加速优势。然而,基准测试可能是一个模糊的追求,尤其是因为Biren无法与Hopper家族中NVIDIA最新的GPU产品相比。虽然BR100基准测试声称战胜了A100,但Biren的GPU没有达到Hopper的水平,后者明显优于A100。
扩大中国GPU的影响力
BR100是GPU市场的一个显著进入者,该市场长期以来只由少数公司主导。如果BR100的表现符合比伦的基准声明,它可能是中国迄今为止最令人印象深刻的GPU产品,标志着半导体行业市场的扩大和地缘政治竞争的扩大。