CPU+GPU架构配置仍是超级计算领域的领导者

中国IC网 20220511

  • 异构计算
  • GPU加速
  • 超级计算

据报道,转眼间接近6月,离新一期TOP500超级计算排名公布的日子不远了。在过去的六个月里,该行业在超级计算方面的行动并不小。新的处理器和新的加速器正在积极加入主要的超级计算中心和国家实验室的大规模部署。目前,国内100亿超级计算系统尚未提交结果,但这并不重要。中国赢得了100亿的比赛,更不用说去年通过新一代神威超级计算打破了量子霸权了。

然而,最近有一种观点开始出现,即超级计算的规模越来越大,结构也越来越复杂。未来,除CPU和GPU外,FPGA、人工智能加速器、量子加速器、神经芯片和硅芯片B-48-3是否会在超级计算中占据更大的份额?在这样的异构系统下,超级计算是否会像其他大型仪器一样更换部件,如大型粒子碰撞机、平方公里阵列射电望远镜?

开始异构化超算。

虽然FPGA已经应用了很多年,但是HPC上出现的次数很少。这并不是缺乏尝试,而是传统FPGA硬件有限,开发工具相对特化,开发人员很难尝试数据科学。

VersalHBM/Xilinx。

然而,近年来,在主要FPGA制造商的努力下,FPGA取得了巨大的发展,其性能足以支持HPC应用程序的运行,FPGA编程终于有了软件开发而不是硬件设计。英国的ExCALIBUR项目开始使用FPGA作为HPC应用程序的测试平台,包括XilinxAlveo、Versal和英特尔Stratix-10。

神经芯片也想取代GPU的位置,桑迪亚国家实验室使用5000万英特尔Loihi神经芯片研究,证明这些芯片不仅适用于解决人工智能挑战,在分子模拟、生物建模这些超级计算应用也可以实现高能效比。

即便如此,我们在TOP500OP500使用新硬件,英特尔、AMD和英伟达仍然占据着绝对的主导地位。

软件移植的实际应用痛点。

但归根结底,TOP500所追求的HPL测试标准并不是衡量超级计算性能的唯一标准,而是专注于带宽的HPCG和更关注延迟的Graph500。异构超级计算可以利用不同硬件的特来打破这些痛点。

松冈聪是日本富岳超级计算的主要贡献者之一,不久前刚刚获得了日本政府的赞扬,但对超级计算的异构趋势表示怀疑。他认为,未来的HPC系统不会由各种设备组成,而是更仔细地选择所使用的处理器,以满足计算、带宽和延迟的需要。

原因很简单,那就是软件生态。如今,HPC代码运行着世界上最复杂的应用,如气象预测、大规模数字双胞胎等。然而,由于复杂性高,这种应用程序无法承受重新编程或淘汰的代价,因为当前的硬件架构在几年内过时。这就是为什么CPU+GPU的配置仍然是超级计算领域的领导者,因为超级计算软件生态在这种架构下已经成熟,可以使用。

以常见的超级计算编程语言Fortran为例。虽然这种语言在数学操作上有很大的优势,但由于维护和移植困难,许多开发人员转向C++/C++,GPU使用更多的C++。因此,即使各种加速器频繁使用,首先使用它们的只是数据中心或人工智能,而不是超级计算。

然而,松冈聪也表示,这并不意味着这些设备不能运行这些代码,或者移植困难并不意味着它们没有尝试的价值,但即使代码可以在这些设备上运行,也很难通过负载平衡来实践古斯塔夫森定律,即处理器数量的增加可以减少程序运行时间,最好的解决方案是CPU或CPU+GPU的同构解决方案。

虽然其他硬件添加异构确实突破了不同的工作流,但超级计算往往是完成计算系统,后续可能只能增加相同的计算资源来提高硬件性能,设计师不能提前判断未来的任务,所以追求这种灵活性不如使用同构这个解决方案。

在使用超级计算机的研究人员和科学家看来,他们已经付出了巨大的努力来实现超级计算机的最大性能。如果超级计算机真的包含了一堆不同架构的设备,那么庞大的编程和移植工作量就足以让他们失去兴趣。他们可能更愿意优化算法或理论,也不愿意花很多时间编程,因为架构的变化。

云化超算成为可行方案?

还有一种观点也得到了很多支持,那就是云化超算。云服务厂商在HPC上的努力有目共睹。在去年的超级计算会议上,国内外大学之间的比赛也在云服务上建立了超级计算系统。云服务厂商也有几家TOP500,微软有5家Azure,最强的Voyager-EUS2甚至排名第十。

虽然云部署超级计算的成本也很大,但对于一些实验室来说,云的模块化特性使他们不必担心他们不使用任何组件,花更少的时间购买超级计算机,花更多的时间使用它。例如,英国政府选择在微软的Azure上部署汇和的CrayEX超级计算,以完成气象预测。更方便的是,由于超级计算消耗了巨大的电力,基础设施可以托管在北欧和其他清洁能源更多的地方。


查看全文

点赞

中国IC网

作者最近更新

  • 一文读懂光电量子计算芯片
    中国IC网
    2024-01-12
  • 电源芯片故障的产生原因及其解决办法分享
    中国IC网
    2024-01-12
  • 意法半导体下一代多区飞行时间传感器提高测距性能和能效
    中国IC网
    2024-01-05

期刊订阅

相关推荐

  • 英特尔机器编程代码相似度系统 让每个人都有能力创建软件

    2020-08-03

  • 华夏芯如何致力于架构自主化发展?

    2020-08-29

  • SSD直接连接到GPU,英伟达终于出手了

    2022-03-16

  • 芯片异构:双英之战

    2022-03-28

评论0条评论

×
私信给中国IC网

点击打开传感搜小程序 - 速览海量产品,精准对接供需

  • 收藏

  • 评论

  • 点赞

  • 分享

收藏文章×

已选择0个收藏夹

新建收藏夹
完成
创建收藏夹 ×
取消 保存

1.点击右上角

2.分享到“朋友圈”或“发送给好友”

×

微信扫一扫,分享到朋友圈

推荐使用浏览器内置分享功能

×

关注微信订阅号

关注微信订阅号,了解更多传感器动态

  • #{faceHtml}

    #{user_name}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 查看评论 回复

    共#{comment_count}条评论

    加载更多

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} #{reback} 回复

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 回复

  • 关闭
      广告