CPU(中央处理器)从单核发展到双核、四核乃至多核,仅仅是这两三年的事情。而今天,随着Llano(发音同lano)在AMD Fusion开发者大会上的首次亮相,我们看到了一个代表未来趋势的新名词——异构计算,它不仅揭示了CPU继多核之后又一个全新的百核时代,更预示着超级计算机将走进个人电脑之中。
2011年6月13~17日,AMD Fusion开发者峰会(下简称AFDS)在美国西雅图召开,这是AMD公司首次针对CPU架构优化及未来程序开发而举办的一次高峰会。与会者除了来自全球的核心媒体记者以外,更有700多名来自全球科研机构和IT公司的开发者,其中大部分为高级程序员或主导程序开发的项目负责人。会议上AMD除了发布新一代A系列APU(代号Llano)以外,集中讨论了如何提高OpenCL(一种支持异构计算的开发工具)和Llano的性能表现。
AMD高级副总裁、产品部门总经理里克·博格曼(Rick Bergman)首先发表主题演讲。他表示:微处理行业正在迎来近十年来的大变革,目前装载AMD Fusion APU的笔记本电脑计算能力已经达400亿次,这一数字明年还将增长50%,预计2020年将达到10万亿次,相当于一台超级电脑的计算能力。
按照AMD的发展规划图,CPU从单核时代性能瓶颈过渡到多核时代,计算性能有了倍数的提升,而接下来的飞跃将来自于异构计算,即CPU与GPU混合加速的时代。
值得注意的是,博格曼提到的400亿次计算能力是指Llano笔记本平台目前所具备的CPU+GPU“综合”计算能力,而非单指CPU的计算能力。我们知道CPU擅长处理复杂的指令计算,其核心数量目前已发展到4核、6核乃至8核,但即便如此,应对高密集的数据处理(比如图形渲染),CPU的计算能力仍不及GPU的1/10,甚至1/100。
AMD自收购ATI以后,一直致力于将GPU的特性融合到CPU当中,因此提出了Fusion(融合)的概念。打一个比方,CPU就像一个全能选手,什么事情都会做,但是效率不算高;而GPU像是许多个精简的CPU,会做的事相对有限,但是执行力很强,处理速度奇快无比。并且GPU的结构也相对简单,因此可以在数量上轻松突破100颗核芯。有了CPU+GPU的组合,各种各样复杂而繁琐的处理任务都可以分别由CPU和GPU来完成,这就是“异构计算”的概念。
我们注意到对于APU异构计算的特性,如何充分发挥CPU+GPU计算的潜力——程序优化——显得尤为重要,这也是本次AFDS重点讨论的内容。AMD在本次大会上力推OpenCL(注1),目的就是吸引更多开发者基于APU进行程序开发。AMD首席科学家菲尔·罗杰斯(Phil Rogers)亲历现场讲解Llano的一些设计技术细节,更结合生动的Demo演示展示了APU异构计算的强大性能,博得台下一阵阵掌声。
除了技术讲解以外,AMD在此次峰会上正式发布了新一代32纳米制程工艺的A系列APU:代号Llano。在此之前,AMD已经推出了两个系列的APU产品E系列和C系列,主要面向超轻薄笔记本、上网本和嵌入式领域。而A系列APU目标定位更为高端,针对主流的PC市场,包括笔记本和台式机,其直接竞争对手就是Intel Sandy Bridge核心的i5和i3处理器。
正如前文所说,Llano处理器内部包含CPU和GPU两个部分,CPU的部分依旧沿用AMD目前的Stars(K10.5)架构,而GPU部分则来自ATI DX11独立显卡的架构。以Llano移动平台A8-3530MX处理器为例,它包含了4颗频率为2.6GHz的CPU核心和400个频率为444MHz的流处理器(GPU)。
如果单论CPU性能,A8-3530MX能够提供略高于目前主流四核心处理器的性能,而其GPU部分的性能则是有史以来为强大的,相当于独立显卡的计算能力。这正是APU的优势所在,也体现出AMD与Intel在处理器设计上不同的优势和策略。
相比整合主板时代的鸡肋感,Llano中集成的流处理器数量达到400个之多,其性能已经达到HD 5570独立显卡的水平。如果拿它与Intel新Sandy Bridge处理器中集成的HD Graphic 3000显卡对比,3D游戏性能至少领先3-4倍。可以说Llano已经可以取代中低端独立显卡的地位,在中等画质下运行主流的3D游戏完全不是问题。
不仅Llano的GPU性能前所未见,相比Intel Sandy Bridge处理器而言,Llano还有一个特点就是处理器可以和独立显卡共同加速,不至于造成系统外接独显后,内部显示核心浪费的问题。从已知信息来看,Llano引入的名为Dual Graphics双显卡技术有点类似于AMD之前的Hybrid CrossFire(混合交火)技术的升级版。在双显卡模式下,系统的游戏性能会比APU单显示核心的游戏性能提升高75%,非常令人期待。
更为重要的是,以Llano为代表的APU支持以OpenCL为标准的并行计算(见前文),这一方面开拓了APU的应用领域,另一方面更使得AMD处理器相比Intel处理器有前所未有的竞争优势。相比较而言,Sandy Bridge处理器中集成的HD Graphic 3000显卡更像是一个专职的图形计算单元,并不能参与通用的并行计算。
一直以来,Intel处理器保持着领先的制程工艺和更低的能耗控制。随着32nm工艺Llano的问世,这个观点可能会被改变。从AMD公布的A系列APU规格来看,集成上百流处理器的Llano的功耗并不夸张,移动版的功耗有35W和45W两种,桌面版的则有65W和100W两种。特别值得一提的是,从一组AMD公布的能耗测试数据来看,在运行相同3D游戏的情况下,Llano不仅帧数更高,而且功耗控制也比相同档次的Sandy Bridge更低(指整体平台的功耗,终结论以本刊测试为准),这一点非常值得我们期待。
另外,AMD在新一代APU中也不忘对原有架构进行优化。比如第二代Turbo Core智能加速技术,它可以更加智能地平衡CPU和GPU的功耗,将GPU闲置时的热量冗余,全部贡献给CPU进行加速,获得更高的效能。还有新一代UVD3解码引擎不仅可以对MPEG-2、H.264和VC-1三大主流高清格式全程硬解支持,还可以硬解Divx/Xvid编码影片,并支持蓝光3D加速。而Steady Video视频稳定技术则更有趣,它可以消除手持DV拍摄视频出现的抖动现象,让播放画面更稳定。
长期以来,CPU性能是大家关注的重点,代表着个人电脑的性能标杆。而随
着以3D图形、高清视频等为代表的视觉系应用的不断丰富,GPU越来越受到关注。过去单纯通过提升CPU频率和核心数量来提升电脑整体性能的方法不仅不能带来更好的用户体验,反倒令能耗居高不下。
借助AFDS大会,AMD不仅向人们传递CPU+GPU的融合时代已经到来,更向人们展示了新一代APU处理器在图形应用、智能化以及并行计算能力方面的优势。AMD将APU称为“x86架构三十年来大革命”,可见对APU自豪之情溢于言表。
不仅如此,APU还解决了计算性能、能耗以及图形处理三方面的平衡问题,让编程者能够随心所欲地调用APU平台所具备的每秒数百亿次计算性能,同时为各种规格的计算设备设计更快、更悦目的应用。
未来,Fusion将成为AMD的战略主轴,而AMD也会在这方面不遗余力地进行创新性开拓。当
然,市场的发展需要多方发力,仅仅是单个上游芯片商是难以推动整个市场发展的,AMD必须能够带动各个产业链环节中的主流企业(包括软件开发、设备制造、IT服务等环节)进行相应的市场跟进,才能确保APU的成功。