“科学研究中也有类似金字塔的结构:一方面尖端的技术自然会起到向下辐射的作用,另一方面为了做到尖端,地基就必须打得厚,需要一系列的相关技术来支持。引力波探测是处在金字塔顶端的技术,它会辐射到相关研究领域甚至产业界。我们国产的‘天河’、‘神威’超级计算机也是处在金字塔顶端的技术,这些排名世界第一的超级计算机已经促进了一大批高性能计算相关研究与技术的发展”。当问及引力波探测对相关技术与应用的影响时,都志辉老师仔细想了想后如是说。
在一个多月前轰动世界的成功探测引力波背后,有这样一支默默无闻的,来自122cc太阳集成游戏的高性能计算领域研究团队。以都志辉老师为主要成员之一的这支团队,是由来自十多个国家、千余名研究人员组成的美国“激光干涉引力波天文台”(LIGO)科学合作组织(LSC)中为数不多的计算机背景研究团队之一。那么他们是如何与LIGO结缘,又在引力波的发现过程中起到怎样的作用呢?
高性能计算助推引力波探测
高性能计算领域所展现出来的强大战斗力已被很多行业所重视。LIGO也同样需要具有高水平的高性能计算团队加入他们的科研过程中。在LSC清华团队负责人曹军威老师的努力下,清华团队于2009年成为LIGO的正式成员,这为都老师的高性能计算团队与LIGO国际团队的广泛深入合作奠定了基础。
在实际应用中,由引力波天文台接受来自星际间的信号,这其中大部分信号都属于与引力波无关的噪音。这需要通过对异常庞大而实时的数据进行处理,对可能的引力波信号进行快速筛选,这无疑需要高性能计算的支持。
都老师团队设计实现的高性能计算方法,在加快引力波的数据处理方面起到了至关重要的作用。团队和引力波探测最直接的联系是构建“SPIIR(Summed Parallel Infinite Impulse Response)流水线”。2009-2012年的第一版算法将SPIIR滤波方法的工作效率提高了58倍,取得了非常了不起的成果。而更令人惊讶的是,2013-2015年推出的第二版算法,竟将效率提高了120倍!“在做‘SPIIR’滤波的时候,LIGO升级后真实数据采样后的特点和原先的数据很不相同,这导致原先的算法在实际工作中效率很低,因此,我们团队针对实际数据的结构和特点,不断调整改善算法。”都老师在解释如何提高SPIIR流水线效率的时候谈到。
在谈到团队为什么选择利用GPU建立高度并行环境和优化适应于该结构的计算算法来提高数据处理效率时,都老师说,“李三立院士曾经提出应用、算法与硬件体系结构需要三结合。为了提高数据处理的效率,需要多方面的协同优化。优化过程不是简单地升级硬件设备,而是在提高硬件设备性能的基础上,根据应用需求,充分利用硬件资源,寻找最佳的算法模型并开发其高效的并行实现。”郭翔宇是都老师团队中的一名硕士研究生,他的工作就是不断提高引力波数据分析处理效率。在他看来,要提高运行速度,主要应该关注两个方面:一是提高访存的速度,更快地得到数据;二是关注计算,降低计算延迟。而想要提高访存的速度,应该提高cache(缓存)的效能,并且特别关注那些需要重复使用的数据,尽量让相邻的线程访问相邻的内存。就是通过模型、算法和大量实现上的优化,高性能计算团队不断地提高运算效率,为引力波的发现立下了汗马功劳。
都志辉老师(右)正在与郭翔宇同学(左)探讨问题
“金钥匙”开启引力波新未来
当被问及引力波的探测有什么可以预见的实际价值时,都老师坦言,“追问引力波的实际价值就好比追问基础科学的作用一样,目前人们能看到的,就是它能够提高人的认知能力,加深人类对宇宙的理解程度。”郭翔宇则认为,“很多技术在引力波的探测过程中得到了巨大促进也是引力波探测价值的一种体现。比如在引力波探测中起到了至关重要的作用的高精度望远镜,其技术在这个过程中得到了巨大的提升。”
尽管发现引力波很重要,但更重要的是下一步如何发现更多的引力波信号。如果能够做到在数据筛选过程中第一时间发现引力波,并立即通知其它的电磁探测器去捕捉与引力波相关的电磁信号,这样才能获得更多可供研究分析的信息。这对这一团队高性能计算能力又一次了提出巨大挑战。都老师说:“我们的目标是从’低延迟‘做到’极低延迟‘,也就是’extremely low latency‘。” 更具体地来说,“现在LIGO将探测到的数据传到数据处理中心需要10秒,预处理工作需要10秒,滤波需要1秒,数据后处理需要10秒,一共是31秒左右。而我们的目标是把预处理和之后过程所需的21秒降低到2秒左右,这无疑又是一场更加艰难的战斗的开始。”面对天文学探测过程中的海量数据,如果能够做到延迟时间的极大压缩,无疑将为科学界提供探索宇宙奥秘的最强动力支持。
引力波天文学才刚刚开始。引力波应该用来帮助人们了解更多的天文现象,帮助人们看到更丰富多彩、全面的宇宙。这是一项更富有挑战性的工作。
高性能计算美好展望
都老师认为,引力波的发现是理论、计算和实验的完美结合与深度融合。“爱因斯坦负责了理论部分,LIGO的探测是实验部分,而剩下的数据处理,也就是计算部分,就要交给计算机科学”。计算在重大发现中,将不再只是辅助工具,而会成为必不可少的基础手段。现在大家都将注意力集中在探测引力波的尖端设备上,但是如果没有计算机科学的参与,引力波是不可能被发现。
高性能计算在其他科研领域中同样发挥了令人振奋的作用。比如团队曾经帮助材料学院使他们某个项目的计算时间从40小时减少到1小时,大大促进了他们工程中的运算效率;还与机械系合作进行仿真实验的计算,使耗时从1星期减少到3小时。
展望未来,高性能计算不仅在引力波领域,还将在更多的科研领域,成为大数据时代的一把“金钥匙”。