位于欧洲核子研究中心(CERN)的大型强子对撞机(LHC)是目前世界上最大的粒子加速器,在里面进行的实验每秒产生大约一百万吉字节(GB ,十亿字节)的数据。即使经过压缩,LHC在一小时内积累的数据也与社交网站脸书整年收集的数据量相当。这么海量的数据,给存储和分析带来了极大难题。幸运的是,粒子物理学家不必自己处理所有这些数据。他们与一种称为机器学习的人工智能(AI )携手合作,来处理这些数据。
来自美国能源部斯坦福直线加速器中心(SLAC)和费米国家加速器实验室的科学家,在8月2
日发表于《自然》杂志的一篇文章中,总结了机器学习在粒子物理学领域的当前应用和未来前景。
该论文共同作者、美国威廉玛丽学院的亚力山大·拉多维奇说:“机器学习算法自己知道如何进行各种分析,这有望为我们节省无数小时的设计和分析工作。” 拉多维奇目前正参与费米实验室的NuMI离轴中微子实验(NOVA)。
机器学习筛查大数据
机器学习已被证明在分析领域非常成功。为了处理像在LHC内进行的那些现代实验中产生的海量数据,研究人员应用所谓的“触发器”—— 专用的硬件和软件,它们能实时决定哪些数据可保存下来以供分析,哪些数据可以丢弃。
论文作者之一、麻省理工学院的迈克·威廉姆斯说,机器学习算法至少可由做出其中70%的决定。威廉姆斯目前正参与LHCb 实验,该实验可帮助科学家揭示为何宇宙中物质的数量远远多于反物质的数量。
LHC中巨大的超环面仪器(ATLAS)与紧凑渺子线圈(CMS )能发现希格斯玻色子,每个探测器都有数百万个传感元件,其信号需要放在一起才能获得有意义的结果。 SLAC的迈克尔· 卡根说道:“这些信号组成了一个复杂的数据空间,我们需要了解它们之间的关系,得出结论,例如,探测器中某个粒子的轨迹是由电子、光子还是其他东西产生。 ”
中微子实验也受益于机器学习。NOVA研究了中微子在穿越地球时如何从一种类型转变为另一种类型,这些中微子振荡可能潜在地揭示一种新类型中微子的存在,一些理论认为,这种中微子是暗物质的粒子。 NOVA的探测器正在监视中微子撞击探测器材料时产生的带电粒子,并且,机器学习算法可以识别它们。