2.1.2 CPU的性能指标
速度一直是计算机硬件发展的一个主题,特别是CPU的发展更是围绕速度展开,更高的频率、更小的制造工艺、更大的高速缓存一直是CPU生产厂家努力的方向。CPU的性能大致上反映出了它所配置的微型计算机的性能,因此CPU的性能指标十分重要。CPU主要的性能指标有以下几点。
1.频率
涉及CPU频率的术语包括主频、外频、倍频、时钟频率、核心频率和工作频率。
主频也就是CPU的时钟频率,未变频时就是CPU的工作频率。一般来说,一个时钟周期完成的指令数是固定的,所以主频越高,CPU的速度也就越快。不过,由于各种CPU的内部结构不尽相同,所以并不能完全用主频来概括CPU的性能。
外频就是系统总线的工作频率。
倍频是指CPU外频与主频相差的倍数,用公式表示就是主频=外频×倍频。
例如,80486DX2-66芯片主频为66MHz,这是设计电路时钟晶振产生的时钟频率,也叫核心频率。如果不超频也不降频,这也是工作频率。倍频为2,所以外频为33 MHz。选定这款CPU就要去找支持33 MHz芯片的主板,这就是为什么要先选定CPU再去买主板,本书正是以此为线索进行编排。
2.总线
总线包括前端总线、HT总线、QPI总线和DMI总线。
总线是将信息以一个或多个源部件传送到一个或多个目的部件的一组传输线。通俗地说,就是多个部件间的公共连线,用于在各个部件之间传输信息。总线的种类很多,前端总线(Front Side Bus,FSB)是CPU与主板北桥芯片之间连接的通道,也称为CPU总线,是PC系统中工作频率最高的总线,也是芯片组与主板的核心。这条总线主要由CPU用来与高速缓存、主存和北桥之间传送信息。由于数据传输最大带宽取决于所有同时传输的数据的宽度和传输频率,而CPU就是通过前端总线连接到北桥芯片,进而通过北桥芯片和内存、显卡交换数据,所以前端总线频率越大,代表着CPU与内存之间的数据传输量越大,更能充分发挥出CPU的功能。前端总线频率常以MHz为单位表示的速度来描述,前端总线频率越大,代表数据传输能力越强,更能充分发挥出CPU的功能。
2003年AMD的CPU集成内存控制器后,将前端总线改写为HyperTransport(超级传输通道,HT),HT总线完成CPU与主板北桥芯片组之间端到端的连接。
Intel把CPU与主板北桥芯片组之间的连接总线命名为QPI(Quick Path Interconnect,快速通道互连),与AMD的HT总线相似,QPI是Intel用来取代FSB的新一代高速总线,使用的是串行的点对点连接技术。
Lynnfield Core i7/i5及Clarkdale Core i3中已将内存控制器和PCI-E控制器集成到CPU,即以往主板北桥芯片组的大部分功能都集成到CPU内部,在与外部接口设备进行连接的时候,提供了一条简洁快速的通道,就是DMI(Direct Media Interface,直接媒体接口)总线。
3.工作电压
工作电压指的也就是CPU正常工作所需的电压。提高工作电压,可以加强CPU内部信号,增加CPU的稳定性,但会导致CPU的发热问题。早期的CPU(386、486)由于工艺落后,工作电压一般为5V,发展到Pentium 586时,已经是3.5V或3.3V甚至2.8V了,随着CPU制造工艺的改进与主频的提高,CPU的工作电压有逐步下降的趋势,Intel出品的Skylake Core i7-6700K电压仅需要1.35V。低电压能解决耗电过大和发热过高的问题,这对于笔记本电脑尤其重要。
4.CPU型号、核心类型和微架构
CPU厂商都会给属于同一系列的CPU产品定一个系列型号,而系列型号则是用于区分CPU性能的重要标识。同一档次系列的CPU按照型号或标称频率又分为不同规格,Intel和AMD对CPU型号的命名方式是不同的。
为了便于对CPU设计、生产、销售的管理,CPU制造商会对各种CPU核心给出相应的代号,这也就是所谓的CPU核心类型。不同的CPU(不同系列或同一系列)都会有不同的核心类型,甚至同一种核心都会有不同版本的类型,核心版本的变更是为了修正上一版存在的一些错误与不足,并提升一定的性能,每一种核心类型都有其相应的制造工艺、核心面积、核心电压、电流大小、晶体管数量、各级缓存的大小、主频范围、流水线架构和支持的指令集、功耗和发热量的大小、封装方式、接口类型及前端总线频率等。
微架构简单来说就是CPU核心的设计方案。目前CPU大致可以分为X86、IA64、RISC等多种微架构,而个人计算机上的微架构,都是基于X86架构设计的,称为X86下的微架构,简称为CPU架构。
AMD在2005年推出了第一款双核CPU,基于K8架构的Athlon64 X2系列,2008年推出基于K10架构的双核Athlon X2系列,2009年推出了K10.5架构的双核Phenom II X2和Athlon II X2。4年来,AMD更新了总共三次CPU架构,也就相当于三代CPU。
5.封装技术
封装是指将集成电路用绝缘的塑料或陶瓷材料打包的技术。以CPU为例,看到的体积和外观并不是真正的CPU的大小和面貌,而是CPU核心等器件经过封装后的产品。封装不仅起着安放、固定、密封、保护芯片和增强散热功能的作用,封装后的芯片也更便于安装和运输。芯片的封装技术已经历了好几代的变迁,从DIP、PQFP、PGA、BGA到FC-PGA,技术指标一代比一代先进。目前封装技术适用的芯片频率越来越高,散热性能越来越好,引脚数逐渐增多,引脚间距逐渐减小,重量逐渐减少,可靠性也越来越高。
6.X86指令集和CPU扩展指令集
提升指令效率是目前公认的提升CPU性能的最有效的方式,同时也是代价最高的。因为这意味着CPU架构要进行更新。常见的方式有超线程技术(伪多核)、超流水线技术、指令预测技术等,需要极高的半导体工艺、运筹学知识,Intel在这一点上遥遥领先于世界上任何一家其他公司。
X86指令集是Intel公司为其第一块16位CPU i8086专门开发的指令集,其简化版i8088使用的也是X86指令,同时为提高浮点数据处理能力而增加了X87处理器,以后就将X86指令集和X87指令集统称为X86指令集。由于Intel X86系列及其兼容CPU(如AMD Athlon XP)都使用X86指令集,所以就形成了今天庞大的X86系列及其兼容CPU阵容。
CPU扩展指令集指的是CPU增加的多媒体或者3D处理指令。这些扩展指令可以提高CPU处理多媒体和3D图形的能力,有MMX(MultiMedia Extension,多媒体扩展)、SSE(Streaming SIMD Extensions,单一指令多数据流扩展)、SSE2(新增加了144条SSE指令,因而称为SSE2)、3DNow!、SSE3及SSE4指令集等。2007年8月底,AMD突然宣布了新的X86架构扩展指令集SSE5,效仿Intel一贯命名方式并断其后路,当时就预计会用于推土机架构,但是Intel的回应是不予支持,并搞出了新的一套AVX高级矢量扩展指令集,现已用于Sandy Bridge。AMD于2009年5月份宣布放弃SSE5,转而支持Intel AVX,并根据自己的架构特点重新定义为XOP(扩展操作指令),同时还保留并增强开发了CVT16(半精度浮点转换)、FMA4(四操作数乘加)。
7.L1/L2/L3高速缓存
L1高速缓存也就是经常说的一级高速缓存。CPU里面内置高速缓存,可以提高CPU的运行效率。内置的L1高速缓存的容量和结构对CPU的性能影响较大,不过高速缓冲存储器均由静态RAM组成,结构较复杂,在CPU管芯面积不能太大的情况下,L1级高速缓存的容量不可能做得太大。
L2高速缓存是指CPU外部的高速缓存。Pentium Pro处理器的L2高速缓存和CPU运行频率相同,但成本昂贵,所以早期L2高速缓存的运行频率相当于CPU频率的一半,现在的L2高速缓存有着与CPU同频和内置于CPU的发展趋势。为降低成本,Intel公司曾生产了一种不带L2高速缓存的CPU,名为赛扬(Celeron)。
L3高速缓存的应用可以进一步降低内存延迟,同时提升大数据量计算时处理器的性能。这都对运行游戏很有帮助。而且在服务器领域增加L3缓存也会极大地提升性能。具有较大L3缓存的配置利用物理内存会更有效,相对于比较慢的磁盘I/O子系统可以处理更多的数据请求;而且能够提供更有效的文件系统缓存行为及较短消息和处理器的队列长度。
8.制造工艺
Pentium CPU的制造工艺是0.35μm,PentiumⅡ和赛扬可以达到0.25μm,新的CPU制造工艺很快将可以达到10μm,并且采用铜配线技术,可以极大地提高CPU的集成度和工作频率。靠工艺技术的不断改进,器件的特征尺寸不断缩小,从而集成度不断提高,功耗降低,器件性能得到提高。芯片制造工艺在1995年以后,历经了0.5μm、0.35μm、0.25μm、0.18μm、0.15μm、0.13μm、90nm、65nm,随着新材料铪的使用,制造工艺达到了45nm、32nm,一直发展到22nm。
9.同时多线程
同时多线程Simultaneous MultiThreading,简称SMT。SMT可通过复制处理器上的结构状态,让同一个处理器上的多个线程同步执行,并共享处理器的执行资源,可最大限度地实现宽发射、乱序的超标量处理,提高处理器运算部件的利用率,缓解由于数据相关或Cache未命中带来的访问内存延时。当没有多个线程可用时,SMT处理器几乎和传统的宽发射超标量处理器一样。SMT最具吸引力的是只需小规模改变处理器核心的设计,几乎不用增加额外的成本,就可以显著地提升效能。多线程技术则可以为高速的运算核心准备更多的待处理数据,减少运算核心的闲置时间。这对于桌面低端系统来说无疑十分具有吸引力。Intel从3.06 GHz Pentium 4开始,所有处理器都将支持SMT技术。SMT源于HT技术,借助QPI技术发展为更具前景的第三代超线程技术。
10.多核心
多核心也指单芯片多处理器(Chip MultiProcessors,CMP)。CMP是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的SMP(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程。与CMP比较,SMT处理器结构的灵活性比较突出。但是,当半导体工艺进入0.18μm以后,线延时已经超过了门延迟,要求CPU的设计通过划分许多规模更小、局部性更好的基本单元结构来进行。相比之下,由于CMP结构已经被划分成多个处理器核来设计,每个核都比较简单,有利于优化设计,因此更有发展前途。多核处理器可以在处理器内部共享缓存,提高缓存利用率,同时简化多处理器系统设计的复杂度。
提高主频是提高CPU性能最简单的方式,但也是瓶颈和代价最高的方式。多核心技术是Intel开发的使CUP满足“横向扩展”的方法,可以使计算机并行处理任务,但是由于在运行中存在性能损失,多核心CPU的实际执行效率远达不到单核心的N倍,关键在于虽然新的操作系统已经对多核心进行了足够的优化,但是绝大多数程序根本没有对多核心进行优化,优化的也一般是仅仅针对双核心优化,对四核心进行优化的少之又少。这不仅是因为适配多核心需要花钱的问题,主要原因还是多核心下CPU逻辑变得异常复杂。可编程性是多核处理器面临的最大问题,一旦核心多过8个,就需要执行程序能够并行处理。在并行计算上,尽管人类已经探索了超过40年,但编写、调试、优化并行处理程序的能力还非常弱。很多程序因为优化不到位反而出现了所谓负优化,这将是CPU在未来亟待解决的问题。市场研究公司In-Stat分析师吉姆克雷格(Jim McGregor)承认,虽然Intel已向外界展示了80核处理器原型,但尴尬的是,目前还没有能够利用这一处理器的操作系统。
2017年3月24日,HUAWEI在国内发布的P10手机处理器都采用麒麟960八核处理器。第七代智能Intel®酷睿™处理器更有10核配置的产品。