新的百亿亿次超级计算机可以在一秒钟内进行百亿亿次计算
“Exascale” 听起来像是科幻小说中的术语,但它其实有一个简单且非常真实的定义:当人脑每秒只能执行大约一个简单的数学运算时,exascale 计算机能在你数出“一个密苏里(One Mississippi)”的时间内至少完成一千万亿次计算。2022 年,世界上第一台正式宣布达到 exascale 等级的计算机 Frontier 在橡树岭国家实验室上线,而且比世界排名第二的计算机快了 2.5 倍。然而,很快就会有竞争者,比如洛斯阿拉莫斯国家实验室的 El Capitan 和阿贡国家实验室的 Aurora。这些 exascale 计算机全部出现在以“国家实验室”结尾的设施中并非偶然。这些新型计算机是美国能源部及其国家核安全管理局(NNSA)的项目。能源部负责监管这些实验室及全美范围内的其他实验室网络。NNSA 的任务是监督核武器储备,而 exascale 计算机的主要目的之一也是通过计算来维护这一储备。但这些超级计算机也用于解决纯科学中的难题。当科学家们完成对 Frontier 的部署,它将专注于基础研究,他们希望借此揭示各个领域的核心真理,比如了解能量是如何产生的、元素是如何形成的,以及宇宙的黑暗部分如何推动其演化——这一切都将通过几乎等同于现实的模拟实现,而这种方式是几年前那些虽然强大但远非顶尖的超级计算机都无法实现的。“原则上,科学界本可以在更早的时候开发并部署 exascale 超级计算机,但它们可能不会像我们现在的标准那样实用、有效且经济。”橡树岭国家实验室计算与计算科学副实验室主任道格拉斯·科思(Douglas Kothe)表示。然而,大规模并行处理、极高的能耗、可靠性、存储和记忆,以及缺乏适合这类超级计算机的软件,这些障碍使得达到当前标准变得困难。经过多年的与高性能计算产业的集中合作,这些障碍终于被克服,从而满足了科学家的需求。Frontier 处理速度比其前辈快了七倍,且内存容量大了四倍。它包含近 10,000 个中央处理器(CPU)——负责执行计算机指令,通常由集成电路制成——以及近 38,000 个图形处理器(GPU)。GPU 最初是为了在游戏时快速、流畅地显示图形内容而设计的,但它们在科学计算中也得到了应用,部分原因在于它们擅长并行处理信息。在 Frontier 中,这两种处理器是相互连接的。GPU 并行执行重复的代数运算。“这使得 CPU 能够更快且更高效地分配任务,”Kothe 说道。“你可以把它比作超级计算天堂里的一次完美组合。”通过将科学问题分解为数十亿个甚至更多小块,Frontier 允许其处理器各自处理一小部分问题。然后,Kothe 表示,“它会重新组合这些结果,得出最终答案。你可以将每个 CPU 比作工厂的主管,而 GPU 则如同工厂前线的工人。”这台超级计算机中的 9,472 个节点——每个节点本质上都是一台并非“超级”的计算机——也以一种可以快速传递信息的方式连接起来。更重要的是,Frontier 并不仅仅比以前的计算机运行得更快,它还拥有更多的内存,因此可以运行更大的模拟,并在同一位置存储大量信息。这就像你在做填色画时,所有的丙烯颜料都放在身边,而不需要每次去桌子另一侧去拿所需的颜色。凭借如此强大的性能,Frontier 以及随后的超级计算机,将帮助人类揭示此前可能仍然模糊不清的世界奥秘。在气象学中,它可能让飓风预测更清晰、更令人信服。在化学中,它可能尝试不同分子结构,看看哪些可以成为优良的超导体或药物成分。在医学上,它已经分析了新冠病毒(SARS-CoV-2)的所有基因突变,将该计算所需的时间从一周缩短到一天,从而揭示这些突变如何影响病毒的传染性。节省下来的时间允许科学家进行超快速迭代,调整他们的想法,并连续进行新的数字实验。Kothe 表示,有了这种计算能力,科学家就不必再做出之前那些近似的假设。他过去经常不得不对老计算机说:“我假设这一项无关紧要,那一项也无关紧要。也许我根本不需要那个方程。”用物理学的术语来说,这被称为“球形奶牛”:把一个复杂的现象,比如牛,简化成一个高度简化的物体,比如球。有了 exascale 计算机,科学家希望不再做这样的简化,而是模拟一头更接近现实的牛。Frontier 升级后的硬件是这一改进的主要因素。但如果科学家没有能充分利用机器新性能的软件,硬件本身对他们的帮助也有限。这就是为什么一项名为“exascale 计算项目”(Exascale Computing Project,简称 ECP)的计划——联合了能源部及其国家核安全管理局,以及产业合作伙伴——资助了 24 个与超级计算机开发并行的科学编码项目。这些软件计划不能只是将以前的代码——比如模拟突发极端天气的代码——放到 Frontier 上运行,并说:“它现在比以前快了一点,但结果还是一样。”为了获得更精确的结果,它们需要一套更强、更优化的代码。“我们不会在这里作弊,用更快的速度来得到一样的不那么理想的答案,”Kothe 说道,他也是 ECP 的主管。但得到更好的结果并不容易,负责一项名为“ExaSky”的早期科学项目的萨尔曼·哈比卜(Salman Habib)表示。“超级计算机本质上就是一种暴力工具,”他说,“所以你必须以聪明的方式使用它们。这才是乐趣所在,是你挠头想‘我该如何实际利用这种可能笨拙的工具,来完成我想做的事情’的地方。”哈比卜担任阿贡国家实验室计算科学部的主管,他希望探索宇宙神秘的组成及其结构的形成与演化。这些模拟将建模宇宙的黑暗部分,并探索宇宙的演化轨迹。模拟将包括宇宙的黑暗部分,并探索宇宙的演化轨迹。虽然他们的极端反应无法在物理实验中完全复制,但数字试验是可能的,而且破坏性更小。第三个早期项目考察的是离我们更近的现象:核反应堆及其反应。ExaSMR 计划将利用 exascale 计算,研究“小型模块化反应堆”(一种核能支持者希望越来越普遍的设施)屏蔽层下发生了什么。在早期,超级计算机只能一次模拟反应堆的某一个组件。后来,它们可以模拟整个系统,但只能在某一时间点——比如反应堆刚启动的时候。“现在我们正模拟反应堆从启动开始,经过整个燃料循环的演变过程,”橡树岭的史蒂文·汉密尔顿(Steven Hamilton)说道,他是该项目的联合负责人。汉密尔顿的团队将研究中子如何移动并影响核裂变的连锁反应,以及裂变产生的热量如何在系统中传播。此前,由于计算机内存不足以同时完成整个模拟的数学运算,因此不可能以空间和时间两个维度的细节来分析热量流动。“我们的下一个重点是研究更广泛的反应堆设计,”汉密尔顿说道,“以提高它们的效率和安全性。”当然,核能总是与核反应的另一个用途——武器——紧密相关。在劳伦斯·利弗莫尔国家实验室,特丽莎·贝利(Teresa Bailey)领导着一个由 150 人组成的团队,其中许多人正忙着为 El Capitan 准备模拟武器的代码。贝利是该实验室的计算物理副项目主任,她监督了“高级模拟与计算”项目(Advanced Simulation and Computing project)——国家安全方面的工作。NNSA 实验室的团队——在 ECP 和面向武器的“先进技术开发与缓解计划”(Advanced Technology Development and Mitigation program)的支持下——开展了相关研发,帮助现代化武器代码。问问任何科学家,像 Frontier、El Capitan 和 Aurora 这样的计算机是否已经足够强大,你永远不会得到“是”的回答。研究人员总是希望拥有更多和更强大的分析能力。此外,还有外在压力推动计算能力的持续提升:不仅仅是为了炫耀,虽然这也很酷,而是因为更好的模拟可能会带来新的药物发现、新的先进材料或新的诺贝尔奖,从而保持国家领先地位。所有这些因素已经让科学家们开始谈论“后 exascale”未来——在他们能在一秒钟内完成一千万亿次数学问题之后会发生什么。这个未来可能涉及量子计算机,或者增强 exascale 系统的人工智能。或者,可能还有别的什么。事实上,也许有人应该运行一次模拟,来预测最可能的结局或最高效的发展路径。
查看全文
作者最近更新
-
我们进化的历史可以教会我们人工智能的未来scientific2023-11-11
-
“ChatGPT检测器”以前所未有的准确率识别人工智能生成的论文scientific2023-11-11
-
人工智能需要规则,但谁将拥有制定规则的权力?scientific2023-11-07
评论0条评论