在这个世界上,每个人都想尽快完成自己的事情/工作。不是吗?从汽车到工业机器再到家用机器,每个人都希望它们工作得更快。你知道这些机器里面是什么东西让它们工作吗?它们是处理器。根据功能的不同,它们可以是微处理器或宏处理器。基本处理器通常每个时钟周期执行一条指令。为了提高加工速度,使机器能够提高速度超标量处理器其具有流水线算法以使其能够在每个时钟周期执行两个指令。它最早是由西摩·克雷的美国疾病控制与预防中心6600于1964年发明的,后来由特贾登和弗林于1970年进行了改进。


摩托罗拉于1988年开发了第一个商用单芯片超标量微处理器MC88100,后来英特尔于1989年推出了I960CA版本,并于1990年推出了AMD 29000系列29050。目前,使用的典型超标量处理器是基于Nehalem微体系结构的Intel Core i7处理器。

尽管如此,超标量的实现正朝着提高复杂性的方向发展。这些处理器的设计通常指的是一组方法,这些方法允许计算机的CPU在执行单个顺序程序的同时,每个周期获得一条以上指令的吞吐量。让我们在本文中进一步了解SuperScalarprocessor体系结构,它减少了执行时间和应用程序。

什么是超标量处理器?

一种微处理器,用于在单个处理器中实现一种称为指令级并行的并行性,通过同时将各种指令分配到处理器上的特殊执行单元,在CLK周期内执行多条指令。A.标量处理器针对每个时钟周期执行单个指令;超标量处理器可以在一个时钟周期内执行一条以上的指令。

超标量的设计技术通常包括并行寄存器重命名、并行指令解码、无序执行和推测执行。因此,在当前的微处理器设计中,这些方法通常与流水线、分支预测、缓存和多核等补充设计方法一起使用。

ding="async" class="size-medium wp-image-43690" src="https://uploads.9icnet.com/images/aritcle/20230518/Superscalar-Processor-300x188.jpg" alt="Superscalar Processor" width="300" height="188" sizes="(max-width: 300px) 100vw, 300px">
超标量处理器

特征

超标量处理器的特点包括以下几点。

  • 超标量体系结构是一种在各种处理器中使用的并行计算技术。
  • 在超标量计算机中,CPU管理多条指令管线,以便在一个时钟周期内同时执行多条指令。
  • 超标量体系结构包括所有流水线功能,尽管在同一流水线内有多条指令同时执行。
  • 超标量设计方法通常包括并行寄存器重命名、并行指令解码、推测执行和无序执行。因此,在最近的微处理器设计中,这些方法通常与缓存、流水线、分支预测和多核等补充设计方法一起使用。

超标量处理器体系结构

我们知道,超标量处理器是指在每个CLK周期执行一条以上指令的CPU,因为处理速度只是以每秒的CLK周期来衡量的。与标量处理器相比,该处理器速度非常快。

超标量处理器体系结构主要包括并行执行单元,这些单元可以同时实现指令。因此,首先,这种并行体系结构是在RISC处理器中实现的,该处理器利用简单而简短的指令来执行计算。因此,由于它们的超标量能力,与以相同兆赫运行的CISC处理器相比,通常RISC处理器的性能更好。但是,现在大多数像英特尔奔腾这样的CISC处理器也包含一些RISC体系结构,这允许它们并行执行指令。

Superscalar Processor Architecture
超标量处理器体系结构

超标量处理器配备了几个处理单元,用于在每个处理阶段并行处理各种指令。通过使用上述体系结构,许多指令在类似的时钟周期内开始执行。这些处理器能够针对每个周期获得上述一条指令的指令执行输出。

在上面的体系结构图中,一个处理器与两个执行单元一起使用,其中一个用于整数,另一个用于浮点运算。指令获取单元(IFU)能够一次读取指令,并将它们存储在指令队列中。在每个周期中,调度单元从队列前端获取和解码多达2条指令。如果存在单个整数、单个浮点指令且没有危险,则两个指令都在类似的时钟周期内调度。

管道内衬

流水线化是将任务分解为子步骤并在不同的处理器部件中执行它们的过程。在下面的超标量流水线中,一次可以提取和调度两条指令,以完成每个周期最多2条指令。标量处理器和超标量处理器中的流水线结构如下所示。

超标量处理器中的指令是从顺序指令流中发出的。它必须允许每个时钟周期有多条指令,并且CPU必须动态检查指令之间的数据依赖性。

在下面的流水线结构中,F被提取,D被解码,E被执行,W是寄存器写回,。在这个流水线体系结构中,I1、I2、I3和I4是指令。

标量处理器流水线体系结构包括一个流水线和四个阶段:获取、解码、执行和结果回写。在单流水线标量处理器中,指令1(I1)中的流水线的工作方式为:;在第一时钟周期I1中,它将进行提取,在第二时钟周期中,它进行解码,并且在第二指令中,I2将进行提取。第三时钟周期中的第三指令I3将获取,I2将解码,I1将执行。在第四个时钟周期中,I4将提取,I3将解码,I2将执行,I1将写入存储器。因此,在七个时钟周期内,它将在单个流水线中执行4条指令。

Scalar Pipelining
标量流水线

超标量处理器流水线体系结构包括两个流水线和四个阶段——获取、解码、执行和结果回写。它是一个2级超标量处理器,这意味着一次有两条指令将进行提取、解码、执行和结果回写。这两条指令I1和I2将在每个时钟周期内一次获取、解码、执行和写回。同时,在下一个时钟周期中,剩余的两条指令I3和I4将同时进行提取、解码、执行和写回。因此,在五个时钟周期内,它将在单个流水线中执行4条指令。

Superscalar Pipelining
超标量管道内衬

因此,标量处理器在每个时钟周期发出单个指令,并在每个时钟循环执行单个流水线级,而超标量处理器在每时钟周期发出两条指令,并并行执行每个级的两个实例。因此,标量处理器中的指令执行需要更多的时间,而超标量处理器中执行指令需要更少的时间.

超标量处理器的类型

这些是市场上可用的不同类型的超标量处理器,下面将进行讨论。

英特尔酷睿i7处理器

英特尔酷睿i7是一款基于Nehalem微体系结构的超标量处理器。在酷睿i7设计中,有各种处理器内核,其中每个处理器内核都是超标量处理器。这是消费端计算机和设备中使用的最快版本的英特尔处理器。与英特尔酷睿i5类似,该处理器嵌入了英特尔Turbo Boost技术。该处理器可访问2到6个品种,同时支持多达12个不同的线程。

Intel Core i7 processor
英特尔酷睿i7处理器

英特尔奔腾处理器

英特尔奔腾处理器的超标量流水线体系结构意味着CPU在每个周期至少执行两条或两条以上的指令。这种处理器被广泛用于个人计算机。英特尔奔腾处理器设备通常是为在线使用、云计算和协作而构建的。因此,这款处理器完美适用于平板电脑和Chromebook,提供强大的本地性能和高效的在线交互。

Intel Pentium Processor
英特尔奔腾处理器

IBM电源PC601

像IBM power PC601这样的超标量处理器来自RISC微处理器的PowerPC家族。该处理器能够为每个时钟发出和退出三条指令,并为3个执行单元中的每个执行单元发出和退出一条指令。为了提高性能,指令完全失灵;但是,PC601将使执行按顺序出现。

IBM Power PC601
IBM电源PC601

功率PC601处理器提供32位逻辑地址、8、16和32位整数数据类型以及32和64位浮点数据类型。对于64位PowerPC的实现,该处理器的体系结构提供了基于64位的整数数据类型、寻址和其他完成基于64位体系结构所需的功能。

MC 88110公司

MC88110是一款单芯片、第二代RISC微处理器,它利用先进的方法来开发指令级并行性。该处理器使用多个片上缓存、超标量指令问题、有限动态指令的记录和推测执行,以实现最大性能,因此它非常适合用作低成本PC和工作站中的中央处理器。

MC 88000
平均8.8万

英特尔i960

英特尔i960是一款超标量处理器,能够在每个处理器时钟周期执行和调度各种独立指令。这是一款基于RISC的微处理器,在20世纪90年代初作为嵌入式微控制器而闻名。这种处理器在一些军事应用中持续使用。

Intel i960
英特尔i960

MIPS R公司

MIPS R是一种动态超标量微处理器,用于执行64位MIPS 4指令集架构。该处理器为每个周期提取和解码4条指令,并将它们发布到五个完全流水线化的低延迟执行单元。此处理器专为高性能、大型和现实世界中内存局部性较差的应用程序而设计。通过近似执行,它只需计算内存地址。MIPS处理器主要用于各种设备,如任天堂Gamecube、SGI的产品线、索尼Playstation 2、PSP和思科路由器。

MIPS R
MIPS R公司

B/W超标量与管道内衬的差异

超标量和流水线之间的区别将在下面讨论。

超标量

管道内衬

超标量是一种CPU,用于在单个处理器中实现一种称为指令级并行的并行形式。 在执行过程中多条指令重叠的情况下,使用了类似流水线的实现技术。
超标量体系结构同时启动多条指令,并分别执行它们。 流水线结构仅针对每个时钟周期执行单个流水线阶段。

 

这些处理器依赖于空间并行性。 这取决于时间上的并行性。
多个操作在单独的硬件上同时运行。 在通用硬件上重叠的几个操作。
它是通过复制硬件资源来实现的,比如寄存器文件端口和执行单元。 它是通过以非常快的CLK周期更深入地流水线执行单元来实现的。

特点

这个超标量处理器特性包括以下内容。

  • 超标量处理器是一种超级流水线模型,其中简单地串行执行独立指令,而没有任何等待情况。
  • 超标量处理器一次获取并解码传入指令流中的几个指令。
  • 超标量处理器的体系结构充分利用了指令级并行的潜力。
  • 超标量处理器主要针对每个周期发出上述单个指令。
  • 发出的指令数量主要取决于指令流中的指令。
  • 指令经常被重新排序,以更好地适应处理器的体系结构。
  • 超标量方法通常与一些识别特征相关联。指令通常是从顺序指令流中发出的。
  • CPU在运行时动态检查指令之间的数据相关性。
  • CPU为每个时钟周期执行多个指令。

优点和缺点

这个超标量处理器的优点包括以下内容。

  • 超标量处理器在单个处理器中实现指令级并行。
  • 这些处理器只是用来执行任何指令集。
  • 包括无序执行分支预测和推测执行在内的超标量处理器可以简单地在几个基本块和循环迭代之上找到并行性。

这个超标量处理器的缺点包括以下内容。

  • 由于功耗的原因,超标量处理器在小型嵌入式系统中使用不多。
  • 在这种体系结构中可能会出现调度问题。
  • 超标量处理器提高了硬件设计的复杂度。
  • 这个处理器中的指令只是根据它们的顺序程序顺序提取的,但这不是最佳的执行顺序。

超标量处理器应用程序

超标量处理器的应用包括以下内容。

  • 超标量执行经常被笔记本电脑或台式机使用。这个处理器只是扫描正在执行的程序,以发现可以作为一个指令集执行的指令集。
  • 超标量处理器包括同时执行各种指令的各种数据路径硬件拷贝。
  • 该处理器主要用于为单个顺序程序的每个时钟周期生成一条以上指令的实现速度。

因此,这一切都是关于超标量处理器的概述——体系结构、类型和应用。这里有一个问题,什么是标量处理器?