首页 资讯 > 内容页

adreno(220)

来源:互联网 发布日期: 2023-08-27 22:18:06

1、智能手机使用的主芯片已经不能简单的称为处理器,而是一个复杂得多的系统,包括处理器、显示加速芯片、内存控制器、视频解码核心、标准总线控制器等。一些甚至包括数字信号处理器。


(资料图片)

2、总的来说,它们被称为片上系统(SoC)。事实上,在一个ARM SoC中,CPU占用的硅面积可能不到总面积的二十分之一,很大一部分面积被各种互连结构占用。其实很好理解,

3、足球就像一个大城市。如果交通不畅,整个城市的运转就会瘫痪。片上系统中有各种总线,内部总线、外部总线、私有总线和公共总线。其中有最重要的外部总线,它连接了几乎所有的内部设备。

4、那是AXI。

5、更重要的是,内存控制器还通过AXI与处理器相连,这意味着无论你或内存控制器能提供多少带宽,处理器能得到的带宽都是直接的,只取决于总线带宽。所以这辆巴士的宽度,

6、它决定了整个系统中最大的内存带宽,在某些情况下也决定了3D等对内存带宽需求很大的模块的性能。就像城市的发展需要高速交通一样,随着片上系统的复杂化,内部互连的带宽也在增加。

7、由于线的信息超出了普通用户的理解范围,厂商往往不会详细说明,所以不容易验证每个芯片的总线宽度。NVIDIA在这一点上是最好的。

8、因为他们已经在网页上直接标注了AXI总线位宽:32bit,类型为AMBA-3(在当前网页上找不到这个参数,原因不明)。这个数字相当“吓人”,因为如果总线宽度真的是32位,

9、也就是说Tegra 2的内部总线位宽只有ARM11级别。所以英伟达很可能在Tegra 2内部采用了与标准ARM不同的总线配置方式,但无论如何,Tegra 2的总线带宽小得令人难以置信。

10、即使AXI频率达到300甚至400MHz,带宽最多也只能达到Cortex A8的水平。根据测试,Tegra 2的内存复制性能只能达到1GB/s左右,基本符合其带宽性能。

11、我们来看看OMAP4430。与很多egra 2的猜测不同,德州仪器提供了完整的OMAP4430技术手册,所以各种信息都非常容易获得。在OMAP4430中,互连结构分为几个层次和级别。

12、但最重要的是L3互联。德州仪器没有使用ARM的AMBA AXI总线,而是在芯片内部的主要互连上采用了Arteris的产品:

13、从图中可以看出,OMAP4430的L3互连宽度为128bit,是Tegra 2的4倍,所以即使工作频率为200MHz,总带宽也能轻松达到3.2GB/s,远超Cortex A8和Tegra 2。

14、说实话,这是双核Cortex A9 MP应该有的水平。当然,由于各种SOC的内部系统不尽相同,Tegra 2的实际情况在这里也不能百分百确定。我们将在以后的测试中继续研究这一点。值得注意的是,

15、当OMAP4430的两个内存控制器搭配LP2 1066时,最大总带宽可以超过8GB/s,但实际效果可能会因为总线带宽而没有相应的提升,这也是ARM系统中比较头疼的问题之一。

16、言归正传,下面继续来看看MSM8x60。一直以来,高通对于自家芯片的技术资料都守口如瓶。这维护了高通的知识产权,但是却苦了这样的人,因为根本无从查证芯片的详细参数,因此只能靠猜测了。一方面,

17、MSM8x60基本上就是“双核版”的MSM8x55,另一方面在后续测试中也可以看出MSM8x60在内存方面的性能并不是很突出,因此在此猜测MSM8x60的内部互联可能和单核时代一样,

18、即64bit、200MHz,总带宽1.6GB/s。各位读者如果有详细的信息,也不妨告知。

19、最后我们来看看Exynos 4210。三星和高通在这个方面有一定的相似性,也不肯公开提供芯片的技术手册。但是我们在三星自己的Exynos 4210宣传资料中还是可以发现一些端倪的。

20、在图中可以明显看出Exynos 4210同样支持双通道内存(DC0与DRAMC1),而在之前的关键技术列表中,三星赫然写出了内存带宽6.4GB/s的数字。

21、由于Exynos 4210是一颗几乎全以ARM公司产品打造的芯片,因此这个数字就意味着Exynos 4210的内部总线宽度可能是惊人的256bit,

22、只有这样才可以在200MHz的频率下达到6.4GB/s的内存带宽。这个数字已经远远的甩开了单核Cortex ATegra 2和MSM8x60,甚至比OMAP4430还要高出一倍,

23、在双核时代的SoC中显然是傲视群雄的。

24、线的研究就到此为止了,依然按照惯例,最后给一个分数:

25、Tegra 2

26、OMAP4430

27、MSM8x60

28、Exynos 4210

29、较量项目四:多媒体

30、作为一台智能手机,多媒体功能是不可或缺的。早在15年前PC处理器巨头Intel就高瞻远瞩,为大家带来了一款叫Pentium MMX的产品,

31、其最大的特色就是引入了名为多媒体扩展(Multi Media eXtension,MMX)的扩展指令集。

32、何谓多媒体扩展指令集?由于原理复杂坚涩,简单的打个比方:厂商们分析平时处理器干哪些事情最慢、又最经常用到,然后把这些最消耗时间的事情固化成电路,做成一个额外的部分,和处理器集成到一起。使用的时候,

33、只通过一条指令,就能够访问和计算多组数据,把最消耗时间的事情尽快做完。在计算机词汇里,这种指令集叫做SIMD(Single Instruction Multiple D,单指令多数据)指令集。

34、回到手机上,在ARM的世界里,由于日益增长的多媒体计需求,也出现了属于ARM自己的多媒体扩展指令集,它的名字叫做NEON。它可以帮助处理器加速任何格式视频的编解码,

35、帮助显示芯片加速矢量数据的解析和打包,也可以让系统可以更快的处理几百万像素的图片。它所能带来的性能提升根据应用的不同,可以从比较明显的50%,到难以置信的8000%。

36、长期以来NEON指令集都是各种高端ARM SoC的标配,从ARM11到Cortex A8,基本上所有高端SoC都包含了对应版本的NEON指令集。而在Cortex A9时代,它更是像是理所应当一样,

37、作为一个基本而不可或缺的功能,出现在各大厂商最高端SoC的蓝图中。

38、在德州仪器的OMAP4430和三星的Exynos 4210中,每一个Cortex A9核心都拥有自己专属的NEON协处理器,拥有专用的32个64位寄存器,以多通道操作的方式,加速系统的多媒体计算性能。

39、而在MSM8x60中,高通甚至把它的NEON协处理器的位宽增加到了128bit,两倍于标准的ARM实现,让NEON协处理器可以一次性处理两倍的数据,带来更大的加速效果。

40、那么Tegra 2呢?令人感到意外的是,不知道出于何种原因或者考虑,Tegra 2没有搭配NEON协处理器。这对于一颗定位于顶级的双核SoC而言是十分不可理解的,

41、因为NEON可以为几乎所有的多媒体过程提供明显的加速特性,而nVIDIA却选择了放弃。可能有读者会说,Tegra 2有强大的显示芯片,不需要NEON的加速,但是不要忘记,

42、显示芯片是不能完全独立处理所有的3D运算过程的,其中诸如数据解包和组合这种操作还是需要CPU来完成,由于没有NEON,处理器必须要花费几倍于对手的时间才能“喂饱”显示核心,

43、最终的结果就是性能无法发挥。

44、而在视频解码方面,Tegra 2也会因为不具备NEON协处理器而受到很大的影响。因为我们知道,Tegra 2虽然号称可以支持诸多格式的1080p全高清解码,但是它对视频的编码格式有着非常严格的要求,

45、例如Tegra 2的视频解码核心只能硬件解码Main Profile的H.264视频,而对于其它的就只能靠处理器来进行软件解压。这时没有NEON协处理器的帮助,视频解压就很难高效的进行,

46、最终导致Tegra 2的多媒体特性缩水。

47、也许nVIDIA是认为NEON协处理器的授权价格过于昂贵,或者可能因为规模太大而提升制造成本,而最终选择了放弃,但作为消费者而言,

48、不具备NEON指令集的Tegra 2无疑会在多媒体方面的竞争中被对手远远甩开。好了,媒体的比拼也要告一段落了,最后我们照例为每个处理器给出评分。

49、Tegra 2

50、OMAP4430

51、MSM8x60

52、Exynos 4210

53、较量项目五:3D加速

54、说到3D加速,这个概念哪怕放在区区5年前,对于手机而言都几乎是可有可无的。但是这几年随着的崛起,与Android的飞速发展,3D加速一夜之间变成了高端手机必备的特性,

55、甚至成为了整个手机用户体验的决定性因素。

56、而在新一代双核Cortex A9 MP SoC中,图形处理器(GPU)的竞争彻底进入了白热化阶段。从结构而言,四家的CPU好歹是一个蓝本(大家所采用的都是ARM v7架构),

57、但四家的GPU却选择了四种完全不同的方案,这的确从另一方面印证了GPU的重要性与竞争的激烈性。

58、nVIDIA作为PC领域图形技术的领导者,在这方面是有着先天的巨大优势。Tegra 2所采用的GPU是nVIDIA自行研发的GeForce Ultra Low Power,

59、缩写为GeForce ULP。它拥有四个顶点处理器,四个像素处理器,支持ES 1.1/2.OpenVG等主流标准。在Tegra 2发布的时候,这枚GeForce ULP就是nVIDIA的宣传重点,

60、因此消费者对于它的性能也有着极大的期待。

61、而作为曾经参与桌面竞争、当下专注嵌入式GPU的Imagination公司,自然不愿意让出嵌入式独立GPU市场的性能领导地位。在OMAP4430上,

62、我们看到的就是这家公司设计的PowerVR SGX540。这是一颗大家很熟悉的GPU,因为早在单核Cortex A8时代,三星就在代号蜂鸟的处理器中采用了这颗GPU,

63、它强大的性能也让采用蜂鸟处理器的机型在单核时代傲视群雄。与GeForce ULP不同的是,PowerVR SGX540内并没有单独的顶点处理器或者像素处理器,而是包含了四组通用处理器。

64、这种类似于桌面显示核心统一渲染器的设计结构可以让PowerVR GPU用最少的硬件获取最大的性能,从而节约成本和功耗。值得一提的是,也正是由于通用处理器的设计,

65、PowerVR SGX540成为了当前唯一一颗支持OpenCL通用运算标准的GPU。

66、而在高通MSM8x60上,GPU则不出意外的是高通自行设计的Adreno。这是高通从前ATi公司收购而来并自行发展的图形架构,经过四代的发展,来到了最新的Adreno 220。

67、相对于单核时代主流的Adreno 205,这颗GPU可以达到前者两倍的性能,从而得以参与到双核时代的GPU争夺战之中。当然,由于高通的“优良传统”,Adreno系列的架构一直不得而知,

68、详细参数也很难查明,但是考虑到这是从ATi收购而来的架构,因此猜测应该也是基于分离的顶点处理器和像素处理器,只是各自的数量依然不甚明确。

69、而四大双核里最后登场的Exynos 4210,它在GPU上的选择也是最为有趣的,因为它所搭载的是由ARM官方设计的Mali400图形核心。这是一颗相对而言比较陌生的显示核心,

70、因为这还是它第一次在顶级SoC中露面。

71、从架构上而言,Mali400也基于分离的顶点处理器与像素处理器,从逻辑角度而言要比PowerVR SGX540落后一些,也不支持OpenCL通用运算标准。但是这样的结构在目前的应用需求下,

72、性能也未必会显得落后。标准的Mali400 GPU包含一组顶点处理器,而像素处理器则可以在一组到四组之间自由搭配,取决于你愿意支付多少授权费和制造成本。

73、由于Exynos 4210是三星最顶级的ARM SoC,因此三星也当仁不让的选择了完整的四像素渲染器配置,即Mali400MP4。稍微岔开一下话题,

74、虽然ARM宣称Mali400的这种设计是“多核心”架构,但Mali400的“MP”与苹果A5处理器所采用的PowerVR SGX543MP2的多核是不一样的,后者才是真正的多核心,

75、而前者只能称之为像素处理器可变而已。

76、那么这四颗GPU的基础性能参数是怎样的呢?我们来看下面这张表格:

77、可以看到,在规格指标方面,Exynos 4210是遥遥领先的,而Tegra 2紧随其后。至于具体的性能表现,我们在后面的测试中将简单介绍。值得注意的是,上表中的参数未必是最终的实际性能,

78、理论参数一般都会受到实际应用环境的强烈影响。

79、不过不管怎样,我们还是要打个分的,暂时按照物理参数吧。

80、Tegra 2

81、OMAP4430

82、MSM8x60

83、Exynos 4210

本文到此结束,希望对大家有所帮助。

关键词:

Copyright   2015-2023 非洲供销网版权所有  备案号: 沪ICP备2022005074号-8   联系邮箱:58 55 97 3@qq.com