易胜博亚盘

浏览量:8473 时间:2018-10-19

来源:内容来自CaviumQLogic ,谢谢。一年一度的国际超级计算大会(SupercomputingConference,以下简称SC)上,每次都有一个非官方的主题出现。过去两年的焦点是机器学习(Machine learning)和深度学习(Deep learning),而在之前则是大规模数据密集计算,以及利用云重塑超级计算未来发展方向的潜力。所有这些主题都有一个共同点,那就是:它们的重点都不是CPU处理器。实际上,它们都是围绕X86架构下的CPU性能提升或生态系统发展的相关话题。回想一下,近年来我们最后一次看到硬件设备成为大会的核心主题,还是在第一批大规模GPU超级计算机进入500强榜单时,然而它们只是加速器而不是设备的核心。在今年的SC17上,核心处理器再次成为了非官方主题。基于ARM架构的硬件和软件生态系统进行了广泛的演示,Cray等超级计算公司还展示了全面的系统集成效果,很多基准测试的结果足以与英特尔的最先进产品相抗衡。基于ARM处理器的“Isambard”超级计算机将包含10,000个内核(采用Cavium的ThunderX2 ARM处理器),将于明年在英国布里斯托大学面世,负责开发该超级计算机的团队一直致力于基于ARM的HPC系统的研究和开发工作。我们现在看到,在基于大量开发工作铺垫的ARM系统中,最著名的当属巴塞罗那超级计算中心的Mont Blanc(几年前开始采用双Cortex-A15 ARM,现在基于Cavium ThunderX2 ARM处理器)。Simon McIntosh-Smith是Isambard项目的领导者之一,也曾参加Mont Blanc项目。他说:“很长时间以来,所有人都在等待ARM处理器领域取得突破。在这方面,Mont Blanc项目是重要而又困难的初期发展阶段。现在,我们终于看到硬件登上舞台中心,展示我们过去几年来的工作成果。随着Cray等公司的全力支持,通过将ThunderX2 ARM处理器应用到Cray XC系列产品,而不仅仅是标准集群中,我们真正实现了突破。硬件必须发挥其应有的作用。”McIntosh-Smith和他的团队日前公布了一些很有意义的基准测试结果。这次基准测试采用了Cray 8节点设备集群和32核ThunderX2 ARM处理器,并与英特尔Skylake和Broadwell解决方案进行了对比。下面列出了在多种HPC应用中进行对比的基准 -McIntosh-Smith表示,总体而言,以内存带宽密集型的任何应用都能够在ThunderX2上很好地运行,性能显著优于 Skylake。然而对于偏向浮点密集型的应用来说,因为Skylake使用了更宽的向量运算器所以会更胜一筹,但是ThunderX2 能与Broadwell平台旗鼓相当。如果继续增加高带宽内存,测试结果会怎么样?这将会非常有趣。