JBTALKS.CC

标题: [转贴]AMD与Intel的区别~ [打印本页]

作者: ^T.N.X^    时间: 2008-2-26 10:39 PM
标题: [转贴]AMD与Intel的区别~
AMD与Intel目前最大的区别就是指令集的区别,双核的概念AMD早就应用了,只不过不如现在的双芯处理器那么的成熟。这也就是为什么英特尔用G代表,而AMD用XXXX+来代表编号,英特尔高频低能,AMD低频高能,所以为什么一般同档次的产品AMD的主频比英特尔的低,其实并不低,只是表现方法不同罢了。例如AMD的2500+就相当于英特尔的2.5G。

CPU的处理性能不应该去看主频,而INTEL正是基于相当相当一部分人对CPU的不了解,采用了加长管线的做法来提高频率,从而误导了相当一部分的人盲目购买。CPU的处理能力简单地说可以看成:
实际处理能力=主频*执行效率,就拿P4E来说他的主频快是建立在使用了更长的管线基础之上的,而主频只与每级管线的执行速度有关与执行效率无关,加长管线的好处在与每级管线的执行速度较快,但是管线越长(级数越多)执行效率越低下,AMD的PR值可能会搞得大家一头雾水,但是却客观划分了与其对手想对应的处理器的能力。为什么实际频率只有1.8G的AMD 2500+处理器运行速度比实际频率2.4G的P4-2.4B还快?为什么采用0.13微米制程的Tulatin核心的处理器最高只能做到1.4G,反而采用0.18微米制程Willamette核心的处理器却能轻松做到2G?下面我们就来分析一下到底是什么原因导致以上两种“怪圈”的存在。

每块CPU中都有“执行管道流水线”的存在(以下简称“管线”),管线对于CPU的关系就类似汽车组装线与汽车之间的关系。CPU的管线并不是物理意义上供数据输入输出的的管路或通道,它是为了执行指令而归纳出的“下一步需要做的事情”。每一个指令的执行都必须经过相同的步骤,我们把这样的步骤称作“级”。管线中的“级”的任务包括分支下一步要执行的指令、分支数据的运算结果、分支结果的存储位置、执行运算等等…… 最基础的CPU管线可以被分为5级:
1、取指令
2、译解指令
3、演算出操作数
4、执行指令
5、存储到高速缓存

你可能会发现以上所说的5级的每一级的描述都非常的概括,同时如果增加一些特殊的级的话,管线将会有所延长:
1、取指令1
2、取指令2
3、译解指令1
4、译解指令2
5、演算出操作数
6、分派操作
7、确定时
8、执行指令
9、存储到高速缓存1
10、存储到高速缓存2

无论是最基本的管线还是延长后的管线都是必须完成同样的任务:接受指令,输出运算结果。两者之间的不同是:前者只有5级,其每一级要比后者10级中的每一级处理更多的工作。如果除此以外的其它细节都完全相同的话,那么你一定希望采用第一种情况的“5级”管线,原因很简单:数据填充5级要比填充10级容易的多。而且如果处理器的管线不是始终充满数据的话,那么将会损失宝贵的执行效率——这将意味着CPU的执行效率会在某种程度上大打折扣。

那么CPU管线的长短有什么不同呢?——其关键在于管线长度并不是简单的重复,可以说它把原来的每一级的工作细化,从而让每一级的工作更加简单,因此在“10级”模式下完成每一级工作的时间要明显的快于“5级”模式。最慢的(也是最复杂)的“级”结构决定了整个管线中的每个“级”的速度——请牢牢记住这一点! 我们假设上述第一种管线模式每一级需要1个时钟周期来执行,最慢可以在1ns内完成的话,那么基于这种管线结构的处理器的主频可以达到1GHz(1/1ns = 1GHz)。现在的情况是CPU内的管线级数越来越多,为此必须明显的缩短时钟周期来提供等于或者高于较短管线处理器的性能。好在,较长管线中每个时钟周期内所做的工作减少了,因此即使处理器频率提升了,但每个时钟周期缩短了,每个“级”所用的时间也就相应的减少了,从而可以让CPU运行在更高的频率上了。

如果采用上述的第二种管线模式,可以把处理器主频提升到2GHz,那么我们应该可以得到相当于原来的处理器2倍的性能——如果管线一直保持满载的话。但事实并非如此,任何CPU内部的管线在预读取的时候总会有出错的情况存在,一旦出错了就必须把这条指令从第一级管线开始重新执行,稍微计算一下就可以得出结论:如果一块拥有5级管线的CPU在执行一条指令的时候,当执行到第4级时出错,那么从第一级管线开始重新执行这条指令的速度,要比一块拥有10级管线的CPU在第8级管线出错时重新执行要快的多,也就是说我们根本无法充分的利用CPU的全部资源,那么我们为什么还需要更高主频的CPU呢??

回溯到几年以前,让我们看看当时1.4GHz和1.5GHz的奔腾四处理器刚刚问世之初的情况:当时Intel公司将原奔腾三处理器的10级管线增加到了奔腾四的20级,管线长度一下提升了100%。最初上市的1.5GHz奔腾四处理器曾经举步维艰,超长的管线带来的负面影响是由于预读取指令的出错从而造成的执行效率严重低下,甚至根本无法同1GHz主频的奔腾三处理器相对垒,但明显的优势就是大幅度的提升了主频,因为20级管线同10级管线相比,每级管线的执行时间缩短了,虽然执行效率降低了,但处理器的主频是根据每级管线的执行时间而定的,跟执行效率没有关系,这也就是为什么采用0.18微米制程的Willamette核心的奔腾四处理器能把主频轻松做到2G的奥秘! 固然,更精湛的制造工艺也能对提升处理器的主频起到作用,当奔腾四换用0.13微米制造工艺的Northwood 核心后,主频的优势才大幅度体现出来,一直冲到了3.4G,长管线的CPU只有在高主频的情况下才能充分发挥优势——用很高的频率、很短的时钟周期来弥补它在预读取指令出错时重新执行指令所浪费的时间。但是,拥有20级管线、采用0.13微米制程的Northwood核心的奔腾四处理器的理论频率极限是3.5G,那怎么办呢?Intel总是会采用“加长管线”这种屡试不爽的主频提升办法——新出来的采用Prescott核心的奔腾四处理器(俗称P4-E),居然采用了31级管线,通过上述介绍,很明显我们能得出Prescott核心的奔四处理器在一个时钟周期的处理效率上会比采用Northwood核心的奔四处理器慢上一大截,也就是说起初的P4-E并不比P4-C的快,虽然P4-E拥有了更大的二级缓存,但在同频率下,P4-E绝对不是P4-C的对手,只有当P4-E的主频提升到了5G以上,才有可能跟P4-3.4C的CPU对垒,著名的CPU效能测试软件SuperPi就能反应出这一差距来:P4-3.4E的处理器,运算Pi值小数点后100万位需要47秒,这仅相当于P4-2.4C的成绩,而P4-3.4C运算只需要31秒,把同频率下的P4-3.4E远远的甩在了后面!! AMD 2500+处理器,采用了10级管线,只有1.8G的主频却能匹敌2.4G的P4;苹果电脑的G4处理器,更是采用了7级管线,只有1.2G的主频却能匹敌2.8C的P4,这些都要归功于更短的管线所带来的更高的执行效率,跟它们相比,执行效率方面Intel输在了管线长度上,但主频提升方面Intel又赢在了管线长度上,因为相对于“管线”这个较专业的问题,大多数消费者还是陌生的,人们只知道“处理器的主频越高速度就越快”这个片面的、错误的、荒谬的理论!

这就是Intel的精明之处!


来自:http://club.bandao.cn/showthread.asp?boardid=171&id=430017
P/S:不知道这帖能不能贴~如果有问题短信息我....

[ 本帖最后由 ^T.N.X^ 于 2008-2-26 10:41 PM 编辑 ]
作者: eremitic    时间: 2008-2-28 08:46 PM
标题: 回复 #1 ^T.N.X^ 的帖子
这个似乎是很久很久以前的事情了

我倒想砍一些更深入的处理器架构的介绍~IBM G4 和 Intel P4 ,一个是risc processor ,一个是cisc processor ~~~难道纯粹比较+-x/l的效率来比较吗。。。。。
作者: ^T.N.X^    时间: 2008-2-28 09:12 PM
标题: 回复 #2 eremitic 的帖子
抱歉~
我找不到你所讲的那些资料~

[ 本帖最后由 ^T.N.X^ 于 2008-2-29 10:53 AM 编辑 ]
作者: ylen    时间: 2008-2-29 12:45 AM
标题: 回复 #1 ^T.N.X^ 的帖子
什么是管线长度???是黄色,黑色,和绿色的吗?? 可以解释吗???谢谢
作者: zechs    时间: 2008-2-29 10:39 AM
原帖由 ylen 于 2008-2-29 12:45 AM 发表
什么是管线长度???是黄色,黑色,和绿色的吗?? 可以解释吗???谢谢


管线=pipeline。pipeline多的话可以让cpu在同一时间执行多个指令(instruction)。
http://en.wikipedia.org/wiki/Pipeline_%28computing%29
作者: ylen    时间: 2008-2-29 12:06 PM
标题: 回复 #5 zechs 的帖子
谢谢。。。。。。
作者: eremitic    时间: 2008-2-29 02:29 PM
标题: 回复 #5 zechs 的帖子
我在想如果把处理器里的处理单位~全部把它分成小组运行~会不会更有效率?也能达到真真的同一时间执行多个指令和降低运算的延迟时间~我的意思就和现在的多核处理器的mutitask ,不过却不是把它多核化。。。。

当然这只是我的概念,~比如说同步化运作(但我想这个需要很精准的预读器),且还需要解决资源的冲突,及很快的乱执行能力,和错误后的从算反应速度。。及等等的
作者: zechs    时间: 2008-2-29 03:29 PM
原帖由 eremitic 于 2008-2-29 02:29 PM 发表
我在想如果把处理器里的处理单位~全部把它分成小组运行~会不会更有效率?也能达到真真的同一时间执行多个指令和降低运算的延迟时间~我的意思就和现在的多核处理器的mutitask ,不过却不是把它多核化。。。。

...


那不就是pipeline吗?
作者: eremitic    时间: 2008-2-29 10:50 PM
标题: 回复 #8 zechs 的帖子
不是。。。。。方法不同~pipeline ~我觉得比较像排着队。而我是想把所谓的pipeline 变得更浅短,然后是以独立线程来分开运作~就好像双核,但却实际来讲又不是双核,很想HT,但却实际在实体上是真真的分开运作~和并非像HT这样是让多个thread在一个clock cycle 塞下其他的process.(所以我就讲像排队~尤其是prescott ~~~排长龙

不过这只是我个人浮浅的看法而已拉~逼近只是随便看看每次他们处理器的tech review而已~~~~可惜我addmath不好,看来是不太可能读这科了
作者: zechs    时间: 2008-2-29 11:46 PM
原帖由 eremitic 于 2008-2-29 10:50 PM 发表
不是。。。。。方法不同~pipeline ~我觉得比较像排着队。而我是想把所谓的pipeline 变得更浅短,然后是以独立线程来分开运作~就好像双核,但却实际来讲又不是双核,很想HT,但却实际在实体上是真真的分开运作~和 ...


基本上我认为如果可以这样做的话,他们早就做了。
比哥哥当年的想法是mhz高就是王道,当年p4破3.0ghz他就说要在2008年实现8.0ghz,不过事与愿违。
作者: real.gigaleon    时间: 2008-2-29 11:58 PM
原帖由 eremitic 于 2008-2-28 08:46 PM 发表
这个似乎是很久很久以前的事情了

我倒想砍一些更深入的处理器架构的介绍~IBM G4 和 Intel P4 ,一个是risc processor ,一个是cisc processor ~~~难道纯粹比较+-x/l的效率来比较吗。。。。。



基本上,RISC,跟现在所用的CISC,简单来说是RISC的重点在于,針對流水線化的處理器優化,但是现在CISC,还有RISC,也是在互相吸取各自的好处,没有记错的话,现在就是將CISC指令轉成RISC指令,让编辑更加方便

说点小历史,有一个时期,是RISC VS CISC,而现在我们的架构是选用了CISC,是历史上的一大遗憾,因为RISC能够让程式编辑者更加方便的编辑


作者: real.gigaleon    时间: 2008-3-1 12:00 AM
原帖由 zechs 于 2008-2-29 10:39 AM 发表


管线=pipeline。pipeline多的话可以让cpu在同一时间执行多个指令(instruction)。
http://en.wikipedia.org/wiki/Pipeline_%28computing%29



pipeline多,能够增加有效的时脉就更高,例如以前最出名的P4,超高流水线,超高频率,超高运算错误率

要知道,流水线过多的话,会让运算容易出错

作者: real.gigaleon    时间: 2008-3-1 12:07 AM
原帖由 eremitic 于 2008-2-29 10:50 PM 发表
不是。。。。。方法不同~pipeline ~我觉得比较像排着队。而我是想把所谓的pipeline 变得更浅短,然后是以独立线程来分开运作~就好像双核,但却实际来讲又不是双核,很想HT,但却实际在实体上是真真的分开运作~和 ...



大概明白你要说什么

其实,你这样的想法没有什么不好,但是要知道,这样做的话,只会让厂商会增大CPU的核心大小,周期会更长罢了,他们用HT,但是又不能很好的分开来做,所以他们选择用双核这种东西更加有经济与实际效益,道理就好像你一个肩膀背着能装10KG的水的水壶,能装很多,但是只会让你走更慢,到不如两个可以装5KG的水壶分两边背,一个满了放另外一个,但是速度效率也提高到比较高

作者: ^T.N.X^    时间: 2008-3-1 06:41 AM
如果这帖是旧的而且又没帮助的话~
就请版主帮我删除掉吧~谢谢
作者: Arsenal_Henry14    时间: 2008-3-3 05:54 AM
那么是AMD的比较好还是INTEL的比较好呢???
作者: TF6    时间: 2008-3-3 06:22 AM
原帖由 real.gigaleon 于 2008-2-29 11:58 PM 发表



基本上,RISC,跟现在所用的CISC,简单来说是RISC的重点在于,針對流水線化的處理器優化,但是现在CISC,还有RISC,也是在互相吸取各自的好处,没有记错的话,现在就是將CISC指令轉成RISC指令,让编辑 ...


谢谢你的说明..我终于明白了...
作者: eremitic    时间: 2008-3-4 05:04 PM
标题: 回复 #10 zechs 的帖子
我个人认为是发展方向问题~processor 的架构从来没有向单一的设计的方向,往往这个方向到了极限,好像才会有一个大改变。

我认为~现在的多核方向~也不一定很好~2颗很好,4颗更好。。。。。。。。

不过到最后还是会遇到bottleneck 吧(猜想,不然就是core unit 一直在以双倍的速度发展,但性能的提升就越来越不明显~好像现在就可以大概的看出来了  

他有讲要出8.0GHz 吗? 我记得prescott 过后,本来intel还想要出一个叫什么 Txxx的核心,目标好像只是5.0ghz左右而已,但无奈从p4 prescott 3.0ghz 其实他因该就可以看得出这不太可能。

终觉得,intel好在有另外一支研发团队。p4 的开发团队,实在是不懂他们在做什么的。。。
作者: real.gigaleon    时间: 2008-3-4 06:48 PM
原帖由 eremitic 于 2008-3-4 05:04 PM 发表
我个人认为是发展方向问题~processor 的架构从来没有向单一的设计的方向,往往这个方向到了极限,好像才会有一个大改变。

我认为~现在的多核方向~也不一定很好~2颗很好,4颗更好。。。。。。。。

不过到最 ...



核心增加到一个数量的时候,出现瓶颈是肯定的,例如说不符合效率要求

放心,到时候自然会有新的发展趋势,轮不到我们担心,我们只要看好戏就OK了

别那么说,以前P4也风光过一时,只是因为疏忽


作者: zechs    时间: 2008-3-4 07:10 PM
原帖由 eremitic 于 2008-3-4 05:04 PM 发表
我个人认为是发展方向问题~processor 的架构从来没有向单一的设计的方向,往往这个方向到了极限,好像才会有一个大改变。

我认为~现在的多核方向~也不一定很好~2颗很好,4颗更好。。。。。。。。

不过到最 ...


有说过,几年前的事了。如果要说单一方向发展,那就是intel了,毕竟双核等其他东西intel都是玩“跟”的。
至于瓶颈问题存不存在要问那些科学家了,不过p4当年的确在没有达到频率发展瓶颈下而转去双核。
而且也有人的p4成功oc到了8ghz= =''
作者: 白色天使_0613    时间: 2008-4-5 09:41 PM
请问下。。。AMD和INTEL哪一个比较好???我不是用来GAMING的。。。只是普通用的。。。
作者: zuozi    时间: 2008-5-7 11:33 PM
发现最近的帖子好像都很乱,都不懂我要跑去那里放好
还是找你们的旧帖子放好哈哈,希望你们不介意
我就帮你们提升帖子的寿命

AMD 最新修定版本 K10.5 Rev. D
45nm SOI、核心︰Hydra
將在 2009 年 Q1 開始試驗生產
L2 追加為 1MB

A家和I家都知道答案了
现在A家和I家又有东西玩了
大家也很清楚知道AMD他的
Agena, Deneb, Propus都是Family name华语不懂要怎样说
hydra我想也是其中之一的Family name

Deneb,Propus 45nm的K10.5过后AMD打算将他现在的K10.5
更新或提升去,分为K10.5 Rev.D和Rev.C,Rev.C将用在Deneb和Propus
而Rev.D将会在Hydra的身上,Rev.D per cores将得到1MB L2的支持
其他的我不解释了,因为我不是翻译师哈哈所以大家加油
以下的Link可以去看看我只是稍微的解释不是很完整
http://forums.vr-zone.com/showthread.php?t=272535
作者: ~神秘王子~    时间: 2008-5-8 09:49 PM
谢谢楼主分享!!
可是这些
我在上电脑课时都懂了
作者: zuozi    时间: 2008-5-9 03:01 PM
标题: 回复 #22 ~神秘王子~ 的帖子
你有上课不代表别人也有上课,所以只是给与那些不懂的人多一份知识
多一份理由
作者: goodhermit95    时间: 2008-5-17 12:11 PM
gaming用AMD
看戏,compress东西,设计用INTEL
不过AMD好像有帮助3D效果
设计不知道用哪一个比较好
作者: zechs    时间: 2008-5-17 01:09 PM
原帖由 goodhermit95 于 2008-5-17 12:11 PM 发表
gaming用AMD
看戏,compress东西,设计用INTEL
不过AMD好像有帮助3D效果
设计不知道用哪一个比较好


compress东西amd赢~
作者: eremitic    时间: 2008-5-27 08:01 PM
标题: 回复 #19 zechs 的帖子
p4 oc 8ghz ~我倒还没见过,不过印象中 pentium m 很好超~6.xx~7.xxghz 都有见过。。。不过那时候我还小,也不清楚是真的假的 (想起了thq~tomshardware 是吗,好像做过干冰超p4 不过好像不高~没记错的话因该是4。xx ~5。xx吧

而这些能上到这个时脉的系统,那些散热系统肯定很夸张~

还要好多的印象~~~pentium m 的效率比p4 高很多,core 2 duo 的架构好像也是。。。pentium m 的开发团队。。。。这些只是一些些的印象~我想因该很多错误的。。。
作者: zechs    时间: 2008-5-27 09:53 PM
原帖由 eremitic 于 2008-5-27 08:01 PM 发表
p4 oc 8ghz ~我倒还没见过,不过印象中 pentium m 很好超~6.xx~7.xxghz 都有见过。。。不过那时候我还小,也不清楚是真的假的 (想起了thq~tomshardware 是吗,好像做过干冰超p4 不过好像不高~没记错的话因该是4 ...


p4 8ghz上google找就有了。pentium m 7ghz没见过= =''
tomshardware的只是“示范”而已。散热最强就是用liquid nitrogen。

pentium m效率好过pentium 4不清楚,忘记了。
不过c2d的notebook效率很像也好过desktop的。
作者: eremitic    时间: 2008-5-28 01:30 PM
标题: 回复 #27 zechs 的帖子
不过c2d的notebook效率很像也好过desktop的

~这个似乎看不出来 ~架构相同~

还有fsb还低过desktop 的。
作者: real.gigaleon    时间: 2008-5-28 02:03 PM
原帖由 zechs 于 2008-5-27 21:53 发表


p4 8ghz上google找就有了。pentium m 7ghz没见过= =''
tomshardware的只是“示范”而已。散热最强就是用liquid nitrogen。

pentium m效率好过pentium 4不清楚,忘记了。
不过c2d的notebook效率很像也好 ...



后期的PM

说相同时脉比的话的确是PM获胜

作者: 车神    时间: 2008-6-2 05:47 PM
感谢楼主的分享,不过要分辨这两大晶片制造商的晶片的管线长度还是一个问题~




欢迎光临 JBTALKS.CC (https://www.jbtalks.my/) Powered by Discuz! X2.5