软件解决方案旨在加速人工智能、量子和GPU处理
为了加速包括人工智能、GPU和量子处理在内的各种类型的先进计算,最近推出了各种软件解决方案。2022年8月26日,作者Ikimi.O
领先的处理器供应商和学术界涌现出了一批新颖的软件创新。这些解决方案有望显著改善各种应用,包括人工智能(AI)、高性能计算(HCP)、医疗保健、制造业等。
这些创新为系统开发人员和EE提供了一些好处,特别是在弥合软硬件集成的差距以及加速人工智能、量子处理和GPU系统方面。
在本文中,我们将对这些创新进行概述,探讨它们对现代计算的影响。
使用Exompilation编程硬件加速器
在最近发表的一篇论文中,麻省理工学院研究员Yuka Ikarashi及其来自麻省理工大学和加州大学伯克利分校的研究团队开发并展示了一种新编程语言的能力,该语言能够实现硬件加速器的高性能编码。
Exo系统概述。图片由Ikarashi和合著者提供
这种名为Exo的新编程语言极大地减少了工程师和开发人员的工作量,他们的任务是用软件配置开箱即用的硬件加速器,以优化与整个应用系统的兼容性。此外,Exo允许低级别的性能工程师使用特殊的加速器芯片以前所未有的速度从简单的程序实现复杂的程序转换。
该语言可以在一个称为“外编译”的过程中利用这些加速器,将简单的矩阵乘法转换为复杂的程序并高速运行。
外汇编优先考虑性能
现有的研究旨在自动化相关硬件的优化过程,而这反过来又导致性能工程师几乎没有过程改进,与此不同,外编译确保性能工程师将系统性能改进置于复杂代码调试和优化之上。
使用Exo,工程师可以将特定于硬件的后端(或优化)与编译器隔离并外部化,并实现高达90%的系统效率。外部化更好地分离了开源项目Exo编程语言和专有硬件专用代码。
尽管Exo利用了特定的硬件加速器芯片,但该团队确定了扩展其语义以支持并行编程模型并将其应用于更多加速器的可能性,包括图形处理单元(GPU)。
英特尔推出开源人工智能参考套件
为了促进对人工智能日益增长的需求,为农业、汽车、电子、制造业等多个行业提供动力,英特尔最近发布了第一套开源人工智能参考套件。
英特尔表示,除了优先考虑准确性、性能和低成本外,它开发这些套件是为了使数据科学家和开发人员能够在零售、医疗保健和其他生产力密集型行业更快、更简化地部署人工智能。
英特尔新的开源人工智能套件包括:
- 公用事业资产健康状况
- 视觉质量控制
- 客户聊天机器人
- 智能文档索引
接下来,我们将详细讨论每个套件。
公用事业资产健康参考工具包
公用事业资产运行状况参考套件是一种预测分析模型,可确保公用事业具有更高的服务可靠性。英特尔表示,该套件满足了全球能源消耗潜在增长对配电资产增长的需求。
公用事业资产健康通过Intel one API数据分析库对公用事业杆的健康状况进行建模。资产使用年限、机械特性、制造商、先前维修、地理空间数据、检查等是模型用于分析的一些数据。
公用事业资产健康参考套件。图片由英特尔提供
视觉质量控制参考套件
英特尔承认质量控制(QC)在制造操作中的关键性,以及计算机视觉QC技术对图形的苛刻要求,因此发布了其视觉质量控制参考套件。
Intel Visual QC参考套件。图片由英特尔提供
AI可视化QC模型将Intel Optimization for PyTorch和Intel Distribution of OpenVINO工具包与oneAPI集成,以实现QC应用程序中更快的训练和推理。根据英特尔的说法,视觉质量控制参考试剂盒可以在基于超参数调整和优化的药丸缺陷检测中提供高达95%的准确率。
客户Chabot参考套件
英特尔表示,客户聊天机器人参考套件确保了人工智能的部署,以支持大规模和高度复杂的对话聊天机器人交互。此工具包利用Intel Extension for PyTorch和Intel Distribution of OpenVINO工具包优化AI模型以获得更好的性能。参考套件还最大限度地减少了用于训练和推理的模型开发代码修改。
客户聊天机器人参考套件。图片由英特尔提供
智能文档索引参考工具包
有了智能文档索引参考套件,企业可以快速部署人工智能,以降低劳动力成本,更快地进行处理和分析。英特尔表示,该套件利用了支持向量分类(SVC)模型与英特尔Modin分发和英特尔扩展的集成,以提高文档索引和排序的训练、推理和数据处理时间,准确率高达95%。
具有智能文档索引功能的数字化文档传送。图片由英特尔提供
Nvidia的QODA融合了量子计算和经典计算
英伟达正在促进量子计算的广泛采用和商业化。本着这些思路,在7月份的一份公告中,该公司推出了量子优化设备架构(QODA),该架构利用了一种连贯的混合量子经典编程模型,有望提高科学生产力并扩大量子研究规模。
此外,该体系结构可以在传统应用方面取得重大进展,增加在短期内实现前所未有的科学突破的潜力。尽管Nvidia表示,顶级量子组织已经在使用Nvidia GPU和高度专业化的Nvidia软件(Nvidia cuQuantum)来开发独立的量子电路,但QODA可以让开发者在GPU加速的超级计算机上构建完整的量子应用程序。
QODA提供了一个统一的编程模型,专为混合环境中的量子处理器设计,与CPU和GPU一起工作。图片由Nvidia提供
Nvidia表示,QODA为多个应用程序提供了灵活性和可扩展性、开放性、高性能、易于集成和高生产力的优势。该体系结构通过在单个GPU上模拟支持混合部署,最高可达Nvidia DGX SuperPOD加上多个量子处理单元(QPU)合作伙伴后端,从而保证了高灵活性和可扩展性。
因为它是开源的,QODA可以连接到各种QPU后端类型,并允许所有用户访问。该技术在端到端变分量子特征解算器(VQE)中提供高性能,加速高达287倍。OODA还提供了与现代GPU加速应用程序的互操作性,并由于精简的混合量子经典开发而提高了量子算法研究的生产力。所有这些都有望帮助HPC开发人员在整合的环境中实现加速的应用程序。
新时代的新工具
电子系统设计师只考虑传统的基于CPU的计算的日子已经一去不复返了。虽然人工智能和GPU计算并不是什么新鲜事,但就事物的规模而言,就可用于加速系统的软件解决方案而言,它们相对年轻。
与此同时,量子计算无疑处于萌芽阶段。为了满足所有这些类型的计算需求,这里讨论的解决方案可能是朝着让工程师更容易实现所有这些技术迈出的一步。