给GNN一堆数据,它自己发现了万有引力定律

2022-03-25 10:01:07   来源:商业新知网

如果牛顿没被苹果砸中,GNN 和符号回归也能发现万有引力定律?

机器学习 (ML) 推动了科学的巨大进步,从粒子物理学到结构生物学再到宇宙学,机器学习能够在大型数据集中学习特征,对不同的对象进行分类,并执行参数推断,以及更具开创性的应用,例如自回归语言模型、预测蛋白质结构,以及蛋白质功能预测。

机器学习强大的学习能力,我们不禁会问,机器学习能否仅仅通过观察我们的太阳系来重新发现万有引力定律?

牛顿的万有引力定律指出,两个质点彼此之间相互吸引的作用力,是与它们的质量乘积成正比,并与它们之间的距离成平方反比。它是经典力学的一部分,是在 1687 年于《自然哲学的数学原理》中首次发表的,并于 1687 年 7 月 5 日首次出版。

近日来自萨塞克斯大学、伦敦大学学院等机构的研究者在论文《 Rediscovering orbital mechanics with machine learning 》中对上述问题进行的解答,他们的回答是:可以。

论文作者之一 Miles Cranmer 推特截图

具体而言,该研究提出了一种采用机器学习方法,通过观察自动发现实际物理系统的控制方程和隐藏属性。研究者训练了一个图神经网络,通过 30 年的轨迹数据来模拟太阳系的太阳、行星和大型卫星的动力学。然后,他们使用符号回归来发现神经网络隐式学习的力学定律解析表达式,结果表明表达式等效于牛顿万有引力定律。

论文地址:https://arxiv.org/pdf/2202.02306.pdf

该研究分为两个阶段:第一阶段的学习模拟器基于图网络 (GN),图网络是一种深度神经网络,可以通过训练来逼近图上的复杂函数。在这里,太阳系的太阳、行星和卫星的(相对)位置和速度被表示为输入图的节点,而天体之间可能的物理交互(例如力)被表示为图的边。该研究将基于 GN 的模拟器与 30 年来观测到的太阳系轨迹进行了拟合。

在第二阶段,该研究分离边函数(edge function),并应用符号回归拟合边函数的解析公式,其最好的拟合是对牛顿万有引力定律的拟合。然后,该研究使用已发现的方程重新拟合未观察到的(相对)天体质量,并找到了与天体真实质量几乎完美的拟合。之后研究者可以使用发现的方程和重新学习的质量来模拟太阳系动力学,并获得与真实观察到的轨迹非常接近的对应关系。

下图为太阳、水星、金星、地球和火星的示意图,以及学习模拟器使用的相应图结构。图的节点代表天体,边的亮度与它们之间的引力相互作用的强度成正比。

数据与模型

数据:符号回归研究历来都专注于玩具(toy)模拟,但是现实世界的数据充满了混乱,包括噪音、信息丢失、未知的物理常数等。因此该研究直接从对太阳系的观察中重新发现轨道力学。

该研究基于 NASA Horizons 的星历表 (Ephemeris)数据开发了一个训练数据集,数据集包括太阳系中质量超过 10^18 kg 的 31 个天体:太阳、行星、冥王星和一系列卫星。训练数据来自 1980 年到 2010 年的 30 年期间的数据,验证集来自 2010-2013 年的数据。

模型:模型是基于 Battaglia 等人在 2018 年提出的交互网络(Interaction Network)的图神经网络 (GNN)。GNN 非常适合物理数据集:它们通过消息传递显式地处理对象(节点)之间的交互,并允许研究者轻松地将对称(如置换、平移和旋转等)嵌入到网络中。

GNN 的唯一输入是天体在给定时刻的位置和速度,以及学习参数。通过训练 GNN 来预测每个天体的加速度,模拟系统的动力学,以及天体的质量。

蒸馏符号规则

接下来,研究者希望找出 GNN 实际学会了哪些规则来预测这些动态。将模型压缩为一组符号规则也可以提高泛化能力。

为此,该研究使用符号回归拟合 GNN 消息传递模块的输入和输出。符号回归是一种机器学习算法,可搜索数百万个符号表达式以拟合数据。该研究使用 PySR 算法 (Cranmer, 2022) 来完成这项任务,其中用到了一种进化算法。

下图是从已经过学习的模拟器中发现的符号表达式,从中可以发现所有情况下输出变量都是 F_x,

更复杂的表达式能更准确地逼近 GNN 的内部函数。然而,人们总是可以在一个简单的表达式中添加其他项来提高它的准确性,所以简单性和准确性是可以权衡的。该研究使用与 Cranmer 等人 (2020) 相同的分数,成功地模拟了牛顿的万有引力定律(如上图蓝绿色所示)。

然后研究者把这个已模拟的规律,放回 GNN 的消息传递模块中,得到的模拟效果如下:

显然,性能变好了一些,但仍然不完美,为什么?

为了解决这个问题,研究者首先比较了每个天体的算法估计质量与真实质量(归一化到太阳的质量范围内):

与每个天体的真实质量相比,模型估计的质量偏差很大,有时甚至相差几个数量级。

虽然 GNN 中的消息传递函数能够很好地近似牛顿万有引力定律,但并不能完全精准地拟合。神经网络可以高度学习非线性函数,但这些质量参数可能对 GNN 来说是良好输入,却不是 GNN 符号版本的最佳输入。

因此,该研究决定通过固定的符号表达式重新拟合质量参数,这种改进确实产生了更好的效果:

此时,模型重新估计的天体质量和真实质量的比较结果如下图所示:

改进之后,模型估计的天体质量几乎完全匹配真实质量。为了解释这一点,研究者认为需要做的是证明该算法的有效性。

我们知道,天体的质量只影响它对其他天体的引力,例如如果地球变成两倍大,月球轨道会受到很大影响,但地球环绕太阳的轨道会保持不变。对于像 Phoebe、Hyperion 和 Nereid 这样的天体,由于它们是非常小的卫星,对其他天体轨迹的影响可以忽略不计。因此,只要它们的质量很小就不会以任何方式影响系统。为了证实这一理论,研究者估计了每个天体对其他天体的引力影响,并联合质量估计的误差作图。

从上图可以发现,两者之间存在明显的负相关,这意味着一个天体对其他天体的引力影响越小,质量估计的效果就越差。这也就解释了该算法如何一步步地成功学习了万有引力定律和预估天体质量。

关键词: 万有引力定律 机器学习

上一篇:
下一篇:
精彩阅读

给GNN一堆数据,它自己发现了万有引力定律

热点

如果牛顿没被苹果砸中,GNN和符号回归也能发现万有引力定律?

电信运营商2021年财报概要分析,总利润率水平比较稳定!

热点

国内三大基础电信运营商(中国移动、中国电信、中国联通)2021年度财报均已发布。

中国移动回A股后首份年报出炉,三大运营商2021年谁最赚钱?

热点

中国电信2021年产业数字化业务收入达到989亿元,同比增长19 4%,增速较2020年显著提升。

52个Martech关键词:SCRM

热点

此外,SCRM与销售、营销和客户服务软件之间的同步可创造各种新的客户参与机会。

不满意、有问题,来联通,找老总!

热点

不满意、有问题,来联通,找老总。

13.78亿!虎年智慧政务第一单,大肉谁吃?四大运营商喝了点汤——

热点

3月16日,一个预算金额为15亿+的超级大单,万众瞩目,揭开谜底。

人事 | 中国电信一位二级副,被知名上市公司聘为总裁!

热点

董事会同意聘请原中国电信安徽分公司副总经理郑家升先生担任公司新任总裁。

联通数科:实力战“疫”,有我守“沪”!

热点

三月以来,上海疫情防控形势日益严峻,防疫工作面临着复杂的重大考验。

又一位中国联通冬奥款待执行天团队员,找到了!

热点

又一位中国联通冬奥款待执行天团队员。

百度百科联合百度超级链发行濒危动物数字藏品助力生物多样性保护

热点

在推出数字藏品之外,百度百科结合动物垂类知识科普,向更广大用户传递濒危动物的生态价值。

财富

苹果高管:MacStudio设计源于公司几十年来的工作

资讯

苹果公司很少推出全新的Mac,但两位负责Mac Studio的高管说,Mac Studio设计源于苹果公司几十年来的工作。在接受《GQ》杂志的最新采访中

营收增速超50%,绿城中国“规模化”提速

资讯

规模化的绿城已经被市场所熟知,规模化冲刺带来的问题同样惹人注意。3月23日,绿城中国于线上召开2021年度业绩发布会。公司全年目标达成率1

贵州茅台再推新电商平台“能买才是真”

资讯

中国贵州茅台酒厂(集团)有限责任公司(以下简称贵州茅台)将再次推出官方电商平台,这一消息迅速成为业界焦点。3月23日,北京商报记者从贵州

Chrome浏览器推出新扩展程序:不尝试将数据传输给微软账号

资讯

微软近日面向 Chrome 浏览器推出了全新的扩展程序 -- Microsoft Bing InPrivate ,在不尝试将数据传输给微软账号或者设备的情况下运

亚都两款空气净化器不合格,空气净化器行业为何深陷泥潭?

资讯

国家市场监督管理总局网站日前公布的《2021年家用电器产品质量国家监督抽查情况通报》显示,2021年抽查了361家企业生产的372批次产品,涉及

2021年冰箱市场:均价双位数增长高端化趋势明显

资讯

2021年,冰箱市场总体呈现增长态势。受产品结构升级和原材料成本攀升的双重影响,2021年冰箱市场均价呈双位数增长,高端化趋势明显。2021年

315曝光台:美团、去哪儿相继被曝出大数据“杀熟”

资讯

近日,315曝光台上,美团和去哪儿相继被曝出大数据杀熟。今年3月3日,一位匿名用户在黑猫平台 上对在线旅游平台去哪儿发起投诉,他已经在

大数据时代,如何保护个人信息?

资讯

一、大数据时代个人隐私数据泄露已成为全球重大的社会问题随着信息技术的飞速发展,数据化生存已逐渐成为人类社会运行的常态,数据在公共管

3月LPR报价公布:1年期3.7%5年期以上4.6%

资讯

3月LPR(贷款市场报价利率)如期公布。3月21日,中国人民银行授权全国银行间同业拆借中心公布,2022年3月21日LPR):1年期为3 7%,5年期以上为

郭明錤:iPhone14系列“新瓶旧酒”是一种营销策略

资讯

郭明錤认为,iPhone 14系列新瓶旧酒的做法,其实是一种营销策略和财务导向的决策。3月20日消息,天风国际分析师郭明錤在社交媒体表示,iPh

电信运营商2021年财报概要分析,总利润率水平比较稳定!

国内三大基础电信运营商(中国移动、中国电信、中国联通)2021年度财报均已发布。

中国移动回A股后首份年报出炉,三大运营商2021年谁最赚钱?

中国电信2021年产业数字化业务收入达到989亿元,同比增长19 4%,增速较2020年显著提升。

52个Martech关键词:SCRM

此外,SCRM与销售、营销和客户服务软件之间的同步可创造各种新的客户参与机会。

不满意、有问题,来联通,找老总!

不满意、有问题,来联通,找老总。

13.78亿!虎年智慧政务第一单,大肉谁吃?四大运营商喝了点汤——

3月16日,一个预算金额为15亿+的超级大单,万众瞩目,揭开谜底。

为户外劳动者提供便利 重庆已建成665座“劳动者港湾”

  中新网重庆4月22日电 (韩璐 王雪宇)记者22日从重庆市城市管理局获悉,2020年重庆市已建成“劳动者港湾”665座。今年,重庆还将继续建

沈阳警方侦破特大贩卖毒品案 抓获88名涉毒违法犯罪嫌疑人

  中新社沈阳4月22日电 (王景巍)沈阳市公安局22日发布消息,近日,在中国公安部和辽宁省公安厅的指导协调下,历经9个多月,沈阳市公安局

上海警方侦破特大制售假普洱茶案 市场价值高达18亿元

  中新网上海4月22日电 (记者 李姝徵)记者22日从上海警方获悉,2021年3月,上海警方全链条侦破一起销售假冒知名品牌普洱茶案,捣毁制售

西安强化知识产权司法保护 商标权案件占比高

  中新网西安4月22日电 (记者 张一辰)在世界知识产权日即将到来之际,西安市中级人民法院(以下简称:西安中院)22日召开新闻发布会,发

今年5月至明年2月底 江西4A级及以上景区对全国学子免门票

  中新网南昌4月22日电 (记者 李韵涵)记者22日从“红五月·嘉游赣”江西五一假日旅游工作媒体吹风会上获悉,2021年5月1日至2022年2月28

福州乡村公益图书馆:图书“接地气” 门口即是农田

  中新网福州4月22日电 (叶秋云 曾路淇)世界读书日即将来临之际,驾车五十余分钟,记者来到距离福建省福州市30多公里的闽侯县白沙镇马