登录 | 注册 English

国家高能物理科学数据中心建立LHAASO数据处理平台,助力科学发现

文章来源:国家高能物理科学数据中心

更新时间:2021-05-17 11:08

       国家重大科技基础设施“高海拔宇宙线观测站”(LHAASO)利用其11个月的实验观测数据,发现了2个能量超过1PeV的光子。这2个超高能光子分别来自天鹅座和蟹状星云,是迄今为止人类观测到能量最高的光子。同时LHAASO还发现了12个稳定的伽马射线源,能量一直延伸到1 PeV。这些发现表明银河系内普遍存在能够将粒子加速至能量超过1 PeV的加速器,并不存在一个过去预言的银河系宇宙线加速源能量极限,打开了“超高能伽马”这一高能天文窗口。这些结果表明以天鹅座恒星形成区、蟹状星云等为代表的非热辐射天体,即年轻的大质量星团、超新星遗迹、脉冲星风云等是银河系超高能宇宙线起源的最佳候选天体,宇宙线起源这一“世纪之谜”有望被揭开。LHAASO实验结果将于2021年5月19日在《Nature》(《自然》)发表。国家高能物理科学数据中心为这一成果的取得起到重要的支撑作用。

图 1 LHAASO对>100TeV超高能伽马射线源的扫描天图(图片来自LHAASO)

       LHAASO是世界上最大的高海拔宇宙线观测装置,实验的数据产生率达到10Gbps以上,每年365天不间断运行。为了高效管理和分析这些海量的科学数据,国家高能物理科学数据中心为LHAASO建立了完整的数据服务平台,实现数据的采集、汇交、存储、共享及处理。LHAASO数据服务平台由稻城海子山(海拔4410米)、北京高能所双数据中心以及合作组单位的分布式计算站点组成。稻城海子山数据中心和北京高能所数据中心之间依托中国科技云高速网络基础设施,实现2.4Gbps带宽的高速数据传输。实验采集的数据首先在稻城海子山数据中心进行初步重建和压缩、快速过滤,然后传输到北京高能所数据中心永久保存。数据在北京数据中心通过复杂的计算过程进行事例重建并形成可用于科学研究的数据产品。数据产品被科学用户用于数据分析和科学研究。到目前为止,LHAASO积累的数据总量达到10PB,文件数达到2亿个。由于数据处理和计算需要大量的计算资源,数据中心承担了LHAASO计算平台的建设和运行任务。目前,该计算平台配备了7000多颗高性能的CPU核,11PB的磁盘存储空间以及25PB存储空间。随着LHAASO持续运行,计算平台规模将不断扩大。


图 2  LHAASO WCDA数据传输实时流量图
 
       建立在LHAASO观测基地的海子山数据中心海拔4410米,是全球最高的数据中心之一。虽然全年平均气温只有1度,但是空气稀薄,传统的风冷制冷技术存在CPU局部过热问题,会导致CPU降频或者死机。浸泡式液冷技术需要采用特定的硬件及泵站,维护复杂,不能满足无人值守的需要。为此,我们采用中科院电工所先进的表贴式无泵自循环蒸发冷却系统,并将热量排放到装配大厅,实现余热利用,绿色节能,无人值守,维护方便,高海拔数据中心的创新运行模式有力保障了LHAASO数据采集系统以及在站数据处理系统的稳定运行。


图 3 LHAASO数据中心(左:海子山;右:北京)
 
       来自中国和欧洲25个研究机构的近300名专业用户通过国家高能物理科学数据中心直接访问数据并使用数据中心的计算资源进行LHAASO科学研究。以2020年为例,LHAASO实验共运行了3450万个作业,约3270万个CPU核时;全年数据访问量高达88PB。LHAASO数据服务平台稳定运行,为高水平科学成果的取得发挥重要的支撑作用。随着科学数据产生的越来越多,国家高能物理科学数据中心也将建立更加完善的数据管理及服务系统,向LHAASO国内外用户提供更加优质数据服务,助力更多重大科学成果的发现。