AWS凭借新型人工智能芯片进入高性能计算市场
AWS展示了其定制的硅,宣布了其最新的专门为HPC应用构建的芯片。2022年12月12日作者:Aaron Carman
在向垂直集成迈出的重要一步中,AWS宣布了三个新的弹性计算云(EC2)实例,它们是用定制的硅构建的,用于高性能计算(HPC)。这些新芯片也标志着亚马逊进入高性能计算领域,缓解了公司对第三方设计的依赖,并与NVIDIA、英特尔和AMD等制造商竞争。
AWS长期以来一直支持基于云的计算和分布式计算。最近的公告不仅标志着即将到来的性能提升,而且标志着向定制硅的转变,为公司提供了改进的、专门构建的系统,可以最大限度地提高性能。
下一代AWS芯片提供的性能提升使各个领域的用户能够以更低的总体成本获得更多的计算资源。图片由TechCrunch提供
在这篇文章中,我们将仔细研究亚马逊的新芯片,它们在HPC/AI领域的预期作用,以及与其他制造商的产品相比的有效性。我们还将审查新的AWS实例,以帮助工程师确定哪种工具适合这项工作。
Graviton3E:高性能、低成本的计算
AWS的Graviton3E(G3E)扩展了其定制处理器系列,是Graviton系列的最新成员。继Graviton3之后,G3E在构建时考虑到了下一代应用。初步结果表明,与Graviton3处理器相比,新芯片的矢量指令性能提高了35%,使其成为计算密集型系统的有力候选者。
C7gn实例(如上所示)可用于网络密集型应用程序,其中吞吐量和带宽至关重要。图片由美国商业资讯提供
2023年初,用户可以开始在两个新的AWS实例上试用新处理器:Hpc7g(HPC)和C7gn(网络密集型)实例。
在这两种情况下,G3E都提供了显著的性能提升。Hpc7g实例的性能比C6gn实例提高了2倍,比Hpc6a实例的性能提高了20%。另一方面,C7gn实例专注于网络带宽和吞吐量,与当前一代相比,带宽增加了一倍,数据包处理增加了50%。
推理2:让机器学习更快
G3E处理器是为了提高计算效率而设计的,而Inferentia2处理器是为人工智能而构建的。推理2允许设计者快速测试、评估和部署他们的推理模型。
Inf2实例为尖端的机器和深度学习应用程序的模型部署提供了重大改进。图片由TechCrunch提供
Inferentia2将出现在新的Inf2实例中,AWS报告称,计算能力提高了3倍,吞吐量提高了4倍,延迟比当前一代Inf1实例低了10倍。此外,Inf2实例可以支持多达1750亿个参数,这使它们成为大型模型的有力竞争者。当前可以预览新的Inf2实例。
将AWS硬件放入AWS数据中心
随着AWS继续生产用于高性能计算的硬件,它使自己在HPC市场上处于竞争地位。G3E处理器可以解决类似于AMD和Intel处理器的HPC问题,而Inferentia2芯片可以擅长并行和数据密集型计算,很像NVIDIA GPU。此外,AWS决定用内部设计取代外包硬件,这可能会影响其传统制造商的客户群。
这并不是说AWS正在放弃所有第三方硬件。例如,新的R7iz实例使用第四代Intel Xeon处理器,以便更有效地访问EDA工具。然而,这表明,内部芯片生产的趋势并不局限于任何一个行业。得益于新铸造的实例,所有领域的工程师和设计师都可以从计算技术的改进中受益。