在即将举行的2023 NAB Show活动之前,AMD今天宣布了其Alveo MA35D媒体加速器卡,该卡基于两个5 nm、基于ASIC的视频处理单元(VPU)。NAB(全美广播协会)节目将于4月15日至19日在内华达州拉斯维加斯举行。

AMD表示,Alveo MA35D支持AV1压缩标准,旨在满足大规模直播互动流媒体服务新时代的需求。

 

The Alveo MA35D media accelerator card embeds two 5 nm, ASIC-based video processing units (VPUs) that support AV1 compression.

Alveo MA35D媒体加速卡嵌入两个5 nm、基于ASIC的视频处理单元(VPU),支持AV1压缩。

 

在这篇文章中,我们概述了新的基于ASIC的加速器旨在解决的问题,我们研究了该设备的关键功能,并分享了AMD产品管理和营销总监Girish Malipeddi和AMD视频战略与开发主管Sean Gardner的意见。

 

向交互式实时视频流的转变

视频直播的性质正在发生变化,加速计算资源需要跟上这种变化。它曾经以广播流媒体为主:一种百万到百万的模式。

一个传统的直播流媒体例子是一场足球比赛。在那里,使用了5秒的延迟。Gardner说:“这种延迟使得利用现有的基于TCP的CDN网络式分发成为可能。”。“这听起来可能不算多,但实时视频需要16毫秒,所以对于任何互动来说,5秒就是一生。”

 

Traditional live video stream was a one-to-millions model, like a football game broadcast for example. A 5 second latency is acceptable in this situation.

传统的直播视频流是百万分之一的模式,比如足球比赛直播。在这种情况下,5秒的延迟是可以接受的。

 

当今和下一代直播视频流基础设施的问题在于,互动模式正在取而代之。随着云游戏、观看派对、远程医疗和社交流媒体等应用程序的多样化,一对数百万的模式正在向数百万对数百万的实时视频流互动模式的主导地位转变。

 

In an interactive live video streaming model, everyone can be a streamer and there are many ingress and egress points for video. The infrastructure has to evolve to meet these new demands.

在交互式实时视频流媒体模型中,每个人都可以成为流媒体,视频有许多入口和出口。基础设施必须不断发展以满足这些新的需求。

 

Malipeddi说,在这个新的交互模型中,延迟变得越来越重要。

 

“在这种新模式中,每个人都成为流媒体,因为这些都是交互式双向流媒体应用程序。”

 

这就需要从根本上改变处理这些流的方式。Malipeddi说,然后基础设施也需要调整来解决这个问题。

Malipeddi说:“总的来说,流量急剧增加,因为从某种意义上说,每个人都成为了广播员。”。“现在有更多的入口和出口流,在某些地方,你可以看到网络和处理很快就会受到限制。”

 

基于ASIC的VPU的媒体加速器

正是考虑到这一点,AMD的工程师开发了新的Alveo MA35D介质加速器卡,该卡基于两个5 nm、基于ASIC的VPU。该卡提供高信道密度,每张卡最多可传输32 x 1080p60个流。这是AMD之前的Alveo U30媒体加速器的通道密度的4倍。

Alveo MA34D上的ASIC基于5 nm工艺构建,即Malipeddi所说的专用VPU。尽管该产品来自AMD业务的Xilinx FPGA方面,但决定这里需要ASIC方法。

加速互动直播的一个重要方面是能够处理规模。Malipeddi说:“我们希望处理成百上千的视频频道。”。他说,要做到这一点,就意味着最大限度地增加每台服务器的频道数量,同时最大限度地减少每条流的功率和带宽。

 

Alveo M34D accelerates the whole video pipeline by using AI-based techniques to both improve video quality and reduce bitrate.

Alveo M34D通过使用基于人工智能的技术来提高视频质量和降低比特率,从而加速整个视频管道。

 

Alveo M34D通过以每个流1瓦的功率为每张卡提供高达32 x 1080p60的流来保持速度。Malipeddi表示,这使得配备8个卡的1U机架服务器能够提供多达256个视频通道。

为了在这些大规模的情况下运行,必须考虑整个管道。“这是关于真正加速整个管道,”Malipeddi说。

 

“我们不想把任何东西移到主机CPU上以降低速度。所以一切都需要在VPU ASIC上完成。”

 

带AI处理器和视频质量引擎的VPU

由于VPU上的所有视频处理功能,CPU和加速器之间的数据移动被最小化。Malipeddi说,这缩小了整体延迟,并最大限度地提高了信道密度,每张卡最多可传输32 x 1080p60、8 x 4Kp60或4 x 8Kp30流。

该卡为主流的H.264和H.265编解码器提供低延迟支持。与同等软件实现相比,其AV1转码器引擎可将比特率降低52%,从而节省带宽。

 

Alveo MA34D的ASIC具有多个处理视频的资源,包括一个与片上视频质量引擎(VQ-QoE引擎)协同工作的AL处理器。

 

ASIC上也采用了人工智能(AI),芯片上有一个专用的AI处理器。该处理器与片上视频质量引擎VQ(QoE引擎)协同工作。正如Gardner所解释的,人工智能处理器逐帧评估内容,并动态调整编码器设置。这提高了感知的视觉质量,同时使比特率最小化。

据该公司介绍,ASIC使用的优化技术包括用于文本和人脸分辨率的感兴趣区域(ROI)编码、用于校正具有高运动和复杂度的场景的伪影检测,以及用于比特率优化的预测见解的内容感知编码。

AMD将在2023年NAB展会N2158展位演示Alevo MA35D。

 

使用的所有图像均由AMD提供