INTEL和AMD处理器架构分析

2023-08-04 1829阅读

例如微处理器的速度、内存规格、使用什么级别的GPU等,没有意识到这些组件的协同效率会对系统产生怎样的影响,而对系统连接的讨论也仅限于总线技术层面。法拉利跑车可以轻松达到每小时300公里以上的速度,但在普通道路上可能不会超过80公里。“微架构”和“连接架构”的神话 Intel声称Core架构远远领先于对手,理由是指令性能优越; AMD还声称K8架构更加科学,内存调用更加高效,连接更加灵活。

1、Intel和AMD处理器系统架构分析讨论:长期以来,我们在讨论计算机性能时,总是关注各个子系统的技术参数。 例如微处理器的速度、内存规格、使用什么级别的GPU等,没有意识到这些组件的协同效率会对系统产生怎样的影响,而对系统连接的讨​​论也仅限于总线技术层面。 这种习惯性的模式让人们很难对计算平台的技术水平有清晰的认识,也造成了概念上的模糊空间,让用户在厂商的宣传中无所适从。 这就是本文要讨论的对象:计算机的连接架构。 法拉利跑车可以轻松达到每小时300公里以上的速度,但在普通道路上可能不会超过80公里。 道路不够宽,路上车流量和弯道太多等等,这些都是影响速度的因素。如果你想让它发挥出它的潜力,那么

2、应设置专用轨道。 对于计算机系统来说也是如此。 计算机系统的性能取决于微处理器、内存、显卡、硬盘等子系统,但即使是最先进的硬件也不一定保证它们以最高效率运行。 事实上,微处理器、内存、显卡和硬盘只能决定它们自身的性能,它们的协作效率是由总线技术和连接架构控制的。 总线技术决定了带宽,类似于道路的宽敞程度和平滑程度,让数据在上面跑得多快; 连接架构定义了两点之间的连接方式,无论是直线还是曲线,路径最短最好,数据传输的效率自然也最高。 谁在说谎? “微架构”和“连接架构”的神话 Intel声称Core架构远远领先于对手,理由是指令性能优越; AMD还声称K8架构更加科学,内存调用更加高效,连接更加灵活。

3. 拿起。 双方的宣传都给出了足够的理由,也有足够的技术解释。 对于这种观点,如果你对处理器技术有一点了解,你就会知道双方都是对的,但这又引出了一个矛盾的问题:哪个平台具有架构优势? 事实上,英特尔和AMD都没有向公众给出详细解释。 他们给用户留下了模糊的认知空间,回避了对方的长处,宣扬了自己的优势。 可以公平地说,英特尔的“酷睿”处理器拥有比竞争对手更好的微架构,而 AMD K8 处理器系列则拥有卓越的连接架构。 在这里,你会发现处理器架构的概念分为两​​种:一种是“微架构”,另一种是“连接架构”。 两者是完全不同的概念,它们从不同的角度影响系统的性能。 和可扩展性。 “微架构”通常是我们衡量微处理器设计的方式

4、第一个接触细节的概念,它描述了处理器最基本的指令执行部分,包括执行方式和运算单元的组成等,就像法拉利的发动机和车身框架跑车,发动机决定了跑车的速度,车身框架让跑车在高速行驶时保持稳定。 通常情况下,处理器的微架构通常都非常稳定,寿命可达5年以上,而且每种微架构往往对应一个处理器家族——例如PentiumIIPentiumIII基于P6微架构,Pentium4家族基于Netburst微架构,目前的Core2Duo/Quad是基于“Core”微架构; AMDAthlon64/X2、Opteron系列、Turion64/X2系列都属于K8微架构。在x86世界里,Intel的Core微架构

5.无疑是最好的,其特点是四发射能力,即每个周期可以同时解码4条x86指令。 Core微架构还结合了微指令融合和宏指令融合两种优化技术。 最多处理 56 条指令。 显然,在相同频率的情况下,处理器的指令并行度越高,实际性能就越强。 正因为这样的优势,Core2Duo处理器能够在较低的频率下保持超越高频Pentium4的优越性能。 相比之下,AMDK8微架构实际上继承自K7系统。 只能同时解码3条指令,并且没有指令优化技术。 K8 和 K7 之间的主要区别在于集成内存控制器和 64 位支持。 如果仅从指令执行的角度来衡量,我们可以认为K8和K7属于同一技术体系,两者都只能解码3

6、指令、并行能力远不如Intel的“酷睿”和PentiumM家族采用的“P6增强”微架构。 不过,AMDK8家族拥有更好的连接架构——微架构决定了芯片的指令执行性能,连接架构决定了系统传递指令的能力。 正如一开始提到的,连接架构就像一条路。 路再好,车也跑不快。 同样,如果指令传递能力跟不上,处理器的执行性能再高也无济于事,因为要浪费大量时间。 在等待中,它会导致有效工作时间的减少(类似于在交通堵塞中等待,从而降低平均速度)。 AMD的K7和K8在微架构上变化很小,指令解码能力没有增强,计算单元数量也没有增加,但是K8的指令执行性能比K7高很多。 关键原因是K8系列有更好的Connection架构。现在的情况

7、很明显:Intel Core平台拥有优秀的微架构,但连接架构落后于对手; AMDK8平台具有落后的微架构,但它具有非常先进的连接架构。 这种情况导致两个竞争对手都有自己的优势和劣势。 至于微架构,之前已经有很多讨论了,这里就不过多讨论了。 本文的重点是PC的连接架构。 我们需要解决一些问题:连接架构在多大程度上影响系统性能和可扩展性? PC的连接架构将发展成什么样的趋势? 80286时代的架构——前端总线+北桥芯片+南桥I/O芯片对于Intel平台来说,前端总线、北桥芯片、南桥芯片的概念自80286以来并没有太大变化处理器通过前端总线与北桥芯片相连。 北桥芯片包括两个逻辑单元:图形接口控制器和内存控制器。 北桥芯片通过特定的总线连接。

8、与南桥芯片连接,南桥芯片负责I/O扩展,包括存储、网络、音频、内部扩展总线(PCI、PCIExpressx1)、外部连接总线(并口、串口、USB)过去二十年,技术改进仅限于各个子系统的规格,如总线速度、内存标准、图形接口标准、磁盘接口标准等,但这种架构并没有本质的改变。 虽然各子系统的规格升级可以显着提升系统性能,但刚性的连接架构也造成了明显的瓶颈,通信时延长的缺点非常明显。 Intel 965系列芯片组基于传统的南北桥连接架构。 这种联系自个人电脑诞生以来就没有发生实质性的改变。 首先我们看一下处理器和内存之间的连接。如图2所示,处理器必须通过“前端总线”连接到北桥芯片,然后

9、与内存系统的数据交换只能通过单/双通道“内存总线”来实现。 那么这个数据交换过程就涉及到两种不同类型的总线。 只有当前端总线的带宽高于内存总线的带宽时,处理器才能充分利用内存资源。 在与AMD平台的对比测试中,Core2Duo平台的内存性能明显处于劣势(配备相同内存系统时),就是这个原因。 但由于技术限制,前端总线很难有太大的提升空间,这意味着内存瓶颈很难消除。 第二个缺陷是内存的访问延迟需要前端总线和北桥芯片的转接,而处理器的内存延迟比较长,导致处理器浪费大量时间等待数据。 即使处理器拥有一流的微架构,也很难充分发挥其潜力。传统的计算机连接架构存在内存访问延迟长、总线带宽瓶颈等缺点。 对于服务器来说,这套

10、连接架构更糟糕:如果服务器包含两个以上处理器,它们都必须通过前端总线访问内存控制器,共同共享内存资源,从而实现多处理器任务协调。 但在实际环境中,多处理器共享内存经常会遇到资源冲突,即两个处理器需要同时对某块内存区域进行读写操作。 一旦发生这种情况,其中一个处理器必须暂停并等待,然后按顺序完成。 系统中处理器数量越多,发生冲突的概率就越高,性能提升也就越小。 一旦达到极限值,继续增加处理器数量将导致系统性能急剧下降。 Intel自家的Xeon平台一直没能突破八通道,迈向高性能计算机(IBMEAX系列芯片组除外),主要原因是连接架构的限制。 Xeon平台的连接架构

INTEL和AMD处理器架构分析

11、处理器之间没有直接通信,共享内存会遇到资源冲突。 Intel目前的Core2Duo计算平台,甚至未来的45nm“Penyrn”平台都没有偏离这种保守的体系,连接架构仍然采用“CPU-北桥(内存控制器+图形接口控制器)+南桥(I/O)”。 )”传统模式下,数据交换的效率不高,这限制了Core平台的进一步性能提升——当然从另一个角度来看,我们可以说Core平台显然具有很高的性能增长潜力。 Core2Duo 目前的性能水平可能只利用了 Core 架构潜力的 70% 到 80%。 构筑PC中的“高速公路”——集成内存控制器+芯片直连总线 AMD在开发K8处理器时,参考了RISC计算平台的经验,改进了平台的连接架构。 K8连接

12、该架构有两个基本关键点:一是将内存控制器集成在处理器内部,处理器核心和内存控制器通过超高速、低延迟的内部总线连接; 二是引入通用的HyperTransport总线技术,实现处理器之间以及处理器与I/O芯片组之间的高速直接连接。 这两项技术有效改变了传统连接方案的弊端,让处理器能够充分发挥其潜力,而不受内存系统的阻碍,也有利于构建更强大的多通道并行计算系统。 首先,让我们看看集成内存控制器的好处。 情况是非常明显的。 现在内存控制器和CPU核心紧密集成,两者之间的数据交换是通过片内总线实现的。 片上总线可以轻松达到数百GB/s的速度,并且访问延迟极低。 传统平台前端总线的限制靠这个

13.支持,可以最大程度地利用内存系统的性能,处理器获取数据的能力大大增强,从而可以将更多的时间花在指令执行上而不是数据等待上。 根据从K7到K8的过渡经验,集成内存控制器设计使内存访问延迟降低了50%,K8的指令性能比K7提高了25%以上。 关键是这项技术的引进。 将内存控制器集成到处理器中可以有效提升内存的性能,整机性能的提升也是相当可观的。 在多通道服务器领域,集成内存控制器的设计已得到广泛认可。 这种设计可以让每个处理器拥有自己的内存系统,不会出现因资源共享而导致的性能下降或访问冲突,系统的多通道扩展变得更加容易。但是,集成内存控制器后,前端的概念侧总线不再存在。

14、针对处理器和I/O芯片之间的信息交换,AMD推出了HyperTranport总线技术,但HyperTranport更大的意义体现在多处理器的扩展上。 AMDK8微架构包含三个独立的HyperTranport控制器,可以支持三个三路HyperTranport总线输出,三路总线可以根据需要与其他处理器和I/O控制芯片连接,进而进行一套完整的高性能计算结合以上两种技术,K8微架构非常适合构建超级计算机系统。 最著名的案例有IBM为美国“洛斯阿拉莫斯”国家实验室设计制造的“RoadRunner”、克雷的“RedStorm”等超级计算机500强名单、AMD Opteron平台

15.占据非常重要的位置。 借助HyperTransport直连总线,Opteron平台可以实现高度灵活的扩展,可用于构建超级计算机系统。 当然,PC不需要考虑多通道扩展的问题。 先进连接架构的优势更多体现在内存性能和可升级性上。 我们知道芯片组中最常更改的规格是内存支持。 现在内存控制器被处理器集成了,芯片组的功能只有图形接口控制器/集成显卡和I/O扩展。 这两部分的功能都很稳定,没有迫切需要升级,连接处理器和芯片组的HyperTranport总线也很稳定。 换句话说,电脑的主板成为一个规格稳定的平台。 如果用户想要升级硬件,只需要更换处理器或者升级内存即可。 AMDK8平台起步并不顺利

16、利用这一优势,另外设计了Socket754、Socket939等不同的插座。 直到SocketAM2的到来,K8平台才充分发挥了连接架构可升级性强的优势。 比如我们可以使用单核Athlon64,也可以换成双核Athlon64X2甚至四核Athlon64X4,而且即将推出的SocketAM2+接口也是向下兼容的。 从用户的角度来看,选择AMD平台可以让电脑拥有更长的生命周期。 相比之下,Intel目前的Core2Duo平台则缺乏这一优势。 虽然AMD拥有先进的连接架构,但K8平台的单机性能却被Core2Duo大幅下降,这是由于K8微架构的落后造成的。 虽然Core2Duo平台在连接架构上比较保守,但在Co

17、借助RE微架构,可以获得全方位的性能领先。 不过,市场的反馈并不如英特尔预期:Core2Duo平台的增速并不如预期,处于不被看好的境地。 性能落后的AMD Athlon64/X2系列并未失去动力,很大程度上得益于K8平台的先进连接。 架构、更长的生命周期保证、丰富的芯片组/主板支持很容易让人心旷神怡; 而Intel平台有着明显的高、中、低端区分,如果你现在买低端平台,就只能局限于低端。Intel似乎持有一种保守、僵化的观念,这不仅体现在市场定位上,也体现在产品技术策略上。 AMD在多通道系统上的辉煌成功让Intel认识到了K8直连架构的优越性。 为此,英特尔决定

18. 中期之后,将推出类似的设计。 即把内存控制器集成在CPU内部,同时使用一条“CSI(全称CommonSerialInterconnect)”高速直连总线建立多处理器以及处理器与I/O芯片之间的互连。 照搬了K8连接架构,但借助一流的酷睿微架构,Intel依然能够实现平台性能的大幅提升。 当然,AMD可以拿出更多噱头的Fusion混合处理器、Torrenza协处理器平台等更先进的连接架构,但如果不及时拿出可以与Core竞争的新一代微架构,它就会AMD很难在平台性能上取得领先,更何况其生产工艺落后Intel一代。强协处理器和集成内存控制器、片间高速的混合处理器的到来

19. 互连总线等功能代表了PC连接架构优化的开始,但还远未结束。 上述两种技术均采用处理器作为系统的核心,显卡和其他PCIExpress扩展只是常规的I/O组件。 这种架构在过去几年里可能还不错。但是,随着DirectX10和统一渲染架构的推出,GPU的可塑性越来越强。 除了3D图形渲染之外,GPU强大的浮点性能还可以用来完成物理计算、流处理、科学计算、图像解码等任务。 加速、图像处理加速等很多对计算性能要求较高的场合,但这样一来,GPU就会与处理器交换大量的数据,虽然无论是PCIExpressxl6总线(芯片组-GPU)还是HyperTransport总线(CPU) -芯片组)足够快,但数据传输过程不可避免地会导致内存占用

20、公交接入延迟时间长的缺点。 1、全方位出击——AMD Torrenza协处理器与Fusion混合处理器架构AMD再次发起连接架构的创新。 它首先提出了Torrenza协处理器平台,仍然使用HyperTransport作为连接中心。 扩展后,它可用于连接浮点协处理器、多媒体协处理器和图形模块。 这样,这类协处理器就可以通过HyperTransport直接与处理器进行高速通信,并且协处理器的位置与主处理器完全对等。 最重要的是图形系统。 AMD通过收购ATI,成功获得了高端显卡业务。 这样就可以直接使用HyperTransport接口启动高端显卡了——AMD现在推出了HyperT

INTEL和AMD处理器架构分析

21. Ransport3.0标准,数据传输频率可达2.6GHz。 如果仍然采用16位接口,那么可以利用10.4GB/S的超高速度进行GPU和处理器之间的低延迟数据交换,有效提升图形系统和主机的性能。 处理器配合的紧密程度,如果此时我们使用GPU来完成一些通用的计算任务,也是可以更加轻松完成的。 到这里,我们不难发现PCIExpress总线已经没有必要了,它的作用被简化为一些无足轻重的系统I/O。 AMD Torrenza协处理器平台,主处理器和协处理器也采用HyperTransport总线实现点对点高速直连A级GPU可直接集成在处理器内部,这

22、是AMD提出的“Fusion”混合处理器计划。 Fusion的想法可能有点惊天动地。 如图7所示,我们可以看到GPU和CPU功能是直接耦合的,两者共享L2缓存和内存控制器,相当于直接替换了双核处理器中的一个CPU核心。 对于 GPU 单元。 在Fusion架构中,GPU和CPU具有相同的能力。 它可以根据需要获取已建立的二级缓存资源,还可以与内存系统进行高速通信。 事实上,此时显存和主存也合二为一了。 这种连接架构最大的优点就是具有极高的资源利用效率。 假设系统配备双通道DDR2800,那么CPU和GPU都可以获得12.8GB/S的内存带宽,加上高速二级缓存的帮助,可以最大程度地保证GPU性能。相比之下,现在

23、K8集成平台将GPU集成到北桥芯片中,北桥通过HyperTransport总线与CPU核心相连,然后通过CPU获得内存控制器的共享权。 这种架构很难保证集成显卡能有多优秀。 记忆性能。 事实上,AMD在设计K8微架构时根本没有考虑到这一点,导致集成芯片组前期很难获得内存资源,图形性能也极其糟糕。 虽然AMD现在已经解决了这个问题,但是集成显卡的显存效率仍然不够。 就卓越性而言,它并不是与Fusion混合处理器同一级别的产品。 AMD Fusion混合处理器、CPU和GPU地位平等,两者都可以直接与内存控制器通信,优化内存性能。 Fusion方案在成本方面也有明显优势。由于功耗问题,Fusion只能集成入门级

24. GPU,不过对于90以上的人来说已经足够了; 而且Fusion的图形性能将接近中端显卡,不再需要购买独立显卡; 受欢迎,整机成本可进一步降低; 另外,系统中只要采用Fusion混合处理器,一颗I/O芯片就可以具备完整的计算功能,整机可以轻松小型化。 这些因素都可以得到显着改善。 降低整机成本。 Fusion还具有更长的生命周期。 如果用户觉得需要升级,只要更换一颗处理器,就可以同时升级CPU、显卡和内存支持。 从这些情况来看,Fusion显然在移动领域、低端消费市场、商用领域都具有突出的优势,其中移动领域是Fusion的重中之重。 在理想条件下,AMD

25、可在25W功耗内实现CPU、GPU、内存控制器的功能,从而在平台功耗方面击败对手,彻底扫除进军超轻薄、商用机型领域的障碍! 无论从任何角度来看,以Fusion为代表的连接架构都有足够的技术噱头。 即使AMD未来没有时间对CPU微架构进行质变,整体性能落后于对手,Fusion仍然可以在移动市场发挥AMD的作用。 杀手角色。 Fusion的引入意味着计算机图形系统也拥有了先进的连接架构。 在CPU方面,AMD也没有停下脚步。 关于AMDK9/K10架构开发的消息由来已久,但AMD至今守口如瓶。过去我们曾收到过这样的消息:K9/K10将直接集成PCIExpress控制器,连接I/O设备和处理器更加紧密

26. 这样做的技术难度并不大。 至少原来的ATI已经掌握了单芯片40个PCIExpress通道的技术能力,集成到处理器中是完全可行的。 然而,我们不应期望集成 PCIExpress 控制器能带来显着的性能提升。 其价值更多体现在降低平台成本,因为芯片组的功能进一步减少,只要有一个具有完整I/O功能的南桥即可。 就是这样。 由于南桥的磁盘接口、音频、网络、USB2.0等功能不会频繁升级,一块主板就可以搞定整个架构的整个生命周期。 当然,这必须是在处理器接口保持稳定的前提下。如果你看到这个趋势,你会发现AMD平台的开放性大大降低了。 除了像NVIDIA这样拥有高端图形技术的芯片组厂商可以依靠SLI来维持高端市场之外,主流和低端市场将逐渐属于AMD自己。

27. VIA、SiS等第三方厂商将继续失去机会。 看到这一趋势,NVIDIA现在正在积极开发通用处理器技术,以创建一个包括处理器、显卡和芯片组的集成平台。 AMD 和英特尔也在创建此类平台。 看来,未来计算机市场的竞争将更多地是平台对决,计算机行业很可能回到封闭时代。 2、“在跑车上安装多个引擎”英特尔的协处理器平台英特尔倡导的协处理器架构就是早已公开的ManyCore计划。 ManyCore的关键点是在处理器中集成了大量的加速单元,比如浮点加速器、多媒体加速器、Java解释器、Flash加速器等。这些加速单元围绕着几个CPU核心,接受来自CPU的任务并执行任务。用 A 将结果传回 A

28. MDTorrenza/Fusion 的点对点模型形成鲜明对比。 Intel的ManyCore计划实际上采用了“主从”模式,集成的协处理器是比较简单的加速单元。 Intel一开始并没有考虑包括GPU和高性能浮点协处理器。 但面对AMD收购ATI带来的威胁,英特尔也在积极寻求高端图形技术,并将推出类似“AMD Fusion”的混合处理器。 截至目前,英特尔尚未详细透露其混合处理器采用何种架构连接。 早期,Intel更有可能将GPU芯片和CPU芯片封装在一起,形成MCM(MultiChipModule)多芯片模块。但目前尚不清楚GPU和CPU将如何使用,以及内存是否控制器是否可以共享还有待观察。

29、集成内存控制器和CSI总线的新架构将在稍后发布,混合处理器将在2009年后推出。Intel 2015处理器愿景:8个通用处理器+64个专用协处理器,主处理器和协处理器内置主从模式写在最后。 如果说微架构决定了计算机大脑的智商,那么连接架构则决定了神经系统的灵敏度。 两者相辅相成,从不同角度对系统性能产生重大影响。 在微架构大战中,英特尔获得了绝对的胜利。 Core以其出色的指令并行性和每瓦性能奠定了x86处理器的巅峰。 x86芯片首次在技术上达到了RISC芯片的水平。但在连接架构的竞争中,情况却完全相反:AMD系统集成内存控制器、HyperTransport直连总线让CPU表现出色

30、优秀的内存使用效率; Fusion架构让GPU获得同样出色的内存效率,Torrenza协处理器平台让超级计算机的构建变得更加容易。 但Intel一直坚持传统的连接架构,开发者并没有从全局的角度对整个平台的连接架构进行任何优化设计。 虽然最终会发生改变,但显然是在追随AMD的脚步。 如果英特尔能够在连接架构上更加前卫,拥有一流的微架构和领先的半导体技术和产能,AMD就完全没有机会了。 我们只是从技术角度讨论微架构和连接架构的问题。 对于PC来说,连接架构对性能的影响并不是那么大。 The difference in micro-architecture is a dominant factor, so as you can see in many evaluations, The Core2Duo platform has obvious advantages in terms of performance. But in the four-way or even eight-way server system, AMDOpteron is more recognized on the technical level.

VPS购买请点击我

文章版权声明:除非注明,否则均为主机测评原创文章,转载或复制请以超链接形式并注明出处。

目录[+]