在TensorFlow里模拟宇宙!提升模拟计算速度,成本降低1000倍
大数据文摘出品
来源:tensorflowblog
编译:睡不着的iris、刘俊寰
去年6月,俄罗斯天文学家兼码农小哥开发了一款名叫Space Engine的宇宙模拟游戏,目前,该游戏已经收到2639份测评,绝大部分都是好评。
不过,Space Engine还只是在游戏层面对宇宙的一种呈现,试想以下,如果用数值模拟的基础工具,从观测的海量宇宙数据进行分析……
停!看到这儿也大概能猜到,这样的模拟计算肯定代价不菲,而且通常需要在大规模的超级算计算机上离线运行。
但是,若是提升模拟计算速度,将其与机器学习组件整合到统一框架内,会有什么不同呢?
这便是新的N体宇宙模拟代码FlowPM在做的。
没错,文摘菌今天给大家展示的就是,如何使用TensorFlow模拟自己的小宇宙,并说明为什么它对宇宙学有着激动人心的前景展望,搓搓小手跟进了~
图1:(蓝色)通过2dFGRS测量的宇宙结构,(红色)使用N体模拟生成的千禧年宇宙结构。
N体宇宙模拟
简单来说,N体模拟的方法是为了解释宇宙演化中的非线性演化问题,科学家们提出的一套研究宇宙学的数值模拟方法。
在宇宙学领域,N体模拟还原了宇宙是如何从诞生之初的大爆炸演变至今的。
如果我们按照物质初始分布,将大量的粒子放置在一个盒子中,由于引力的牵引,粒子会不断移动。而最终的粒子状态,就是对浩瀚宇宙结构的再现。例如,从这个分布中,你可以看到星系和星系群是如何分布的。
这些结构的形成和演化取决于一些与宇宙相关的基础问题,诸如宇宙中有多少物质?宇宙膨胀有多快?导致宇宙膨胀的黑物质和暗能量有哪些特性?
现代的宇宙学研究用强大的望远镜覆盖了辽阔的观测区域,绘制出了这些结构,时间甚至可以追溯到几十亿年前。通过将N体模拟的预测与观测数据进行比较,可以帮助我们解答前述基础问题,从而提高对宇宙的诞生和演化的理解。
FlowPM:一个TensorFlow的宇宙N体求解程序
随着几十年研究的更迭,N体模拟已是宇宙学界的主要研究工具。
得益于机器学习和统计推理领域的最新进展,一个完全基于TensorFlow实现的N体宇宙模拟程序FlowPM应运而生了。
在这里,我们使用Google Colab notebook对其进行实验,同时,以下主要提供TF1的编写代码。
首先需要设置好边长、网格大小和执行代码片段等模拟参数,随后的执行模拟代码片段就非常简单了,完整的代码如下所示,如此就能生成下图所示的大型结构。
# Generate Gaussian initial conditions for the matter distribution
initial_conditions = flowpm.linear_field(N, L, ipklin, batch_size=batch)
# Sample particles, i.e. generate the initial displacement and velocity
state = flowpm.lpt_init(initial_conditions, a0=a0)
# Evolve particles from initial state down to present time with N-Body simulations
final_state = flowpm.nbody(state, stages, N)
# Visualize final density field i.e interpolate the particles to a grid
Final_field = flowpm.cic_paint(tf.zeros_like(initial_conditions), final_state[0])
#Execute the graph!
with tf.Session() as sess:
ic, istate, fstate, sim = sess.run([initial_conditions, state, final_state, final_field])
图2 :(左)N体模拟启动时,宇宙中物质的初始分布;(右)在模拟的最终快照,物质的最终分布。可以清楚地看到大型结构,具有晕圈,长丝和空洞塌陷。
或许不少人会疑惑,TensorFlow真有这么香?文摘菌把话撂这,还这真有这么香,TensorFlow的优势主要体现在以下两个方面。
首先是分析和推理,TensorFlow模拟为宇宙学家提供了前所未有的独特功能,也就是我们所说的可微性(differentiability)。这个功能为科学家提供一种新的分析工具,例如开发基于模拟的有效推理技术。
不仅如此,这个功能还支持量化各类输入参数的调整对最终观察的影响。在伯克利宇宙中心,研究者们对时光倒流和重构初始状态十分感兴趣,这也有助于更好地了解现在的宇宙结构,但这是有前提的,必须先解决一个百万维度的高度非线性优化问题,即模拟过程得可微,而这,FlowPM就能做到,重构后的图如下所示。
从最终的黑物质的大型宇宙结构(右边)如何重建宇宙初始状态(左边)
另一个就是混合物理/深度学习模拟,在N体模拟运用深度学习组件时,你会需要开发一个混合前向模型。但是,利用当前的计算资源,不可能高度准确地同时模拟所有的组件,只能依据科研目标,在不同元素之间进行取舍,例如宇宙可观察的深度、星系可见的范围和形成星系的多维物理过程等。
然而现在,我们可以用深度学习替代模型,将这些元素自然地整合进N体模拟中。在BCCP,科学家们开发了一个这样的混合模拟,如下图所示。假如我们要模拟宇宙中的气体动量密度,目前,这类观察采用混合模拟实现代价非常大,但使用一个端到端的FlowPM模型,成本至少可以降低1000倍。
一个混合模拟的示例,用两层的非线性变换(网络)补充PM模拟的暗物质输出(左),以模拟宇宙(中心)的气体动量密度。将使用昂贵1000倍的混合模拟所模拟与真相进行比较(右)
采用Mesh TensorFlow分布式框架仿真
虽然原理看上去很简单,但实际的挑战还是很大的,毕竟宇宙真的很庞大!
为了准确匹配当前和未来的观测,我们要同时模拟数以亿计的粒子的变化。
要实现这个,N体宇宙模拟主要有以下两个难点:
- 连续演化数十亿个粒子,计算成本非常高。要估算所有粒子之间的重力,需要计算所有的粒子对,当计算规模扩展至N2,无法得出结果。但幸运的是,可以在FlowPM中使用一种叫做particle-mesh(PM)的方法,即把一个Ng规格的网格离散空间,使用高度优化的3D快速傅里叶变换计算整个空间的力,这将计算成本从N2g降到了Nglog(Ng)。
- 尽管算法进行了优化,但模拟数以万计的粒子也非常占用内存。结果是一个有效尺寸为1024x1024x1024的最小的模拟网格,都无法再单个GPU上显示。因此,我们需要一个模型并行框架来支撑大规模模拟,这也正是Mesh TensorFlow的用武之地。
Mesh TensorFlow框架可以轻松地使用分布式张量来表示模拟,并持续追踪分布式梯度和设备之间的存储通信,通过Mesh TensorFlow编写N体求解程序,可以将巨大的仿真量跨多个超级计算机进行分布。
在这种模拟中,每一步操作和网格组件在一个时间步长可以演化出不同的空间区域。在云端TPU部署相同的模拟代码,可以模拟128个128x128x128网格的独立宇宙,或者部署在国家计算机(NERSC)的64个GPU上模拟一个1024x1024x1024的宇宙。
除了支持大规模仿真,模型并行框架允许通过将计算任务分配给多个处理器来加速中间尺寸的模拟,如下图所示,FlowPM的平均模拟速度比当前的可微python模拟器FastPM快了40倍不止。
使用FastPM(在Cori Haswell内核上运行基于CPU的python代码)和FlowPM(在Cori GPU上运行基于GPU的Mesh TensorFlow代码)模拟2563网格PM,比较1个步长内时间缩放与处理器数量
展望
过去的三十多年,数值模拟是大型宇宙的研究基石。现在,有了FlowPM,研究即将迈出新的一步,将模拟器集成在包含深度学习组件的统一框架内,同时保持对潜在现象的准确物理理解。
在宇宙学中,这种结合不仅促生了新颖的分析工具,在研究体系中加入深度模型攻克棘手的历史难题。这些活跃的研究领域,加速催生下一代宇宙研究,在未来的十年之际可以观察宇宙中成千上万的个体。
多亏了Mesh TensorFlow模型并行框架,使得物理建模和机器学习的融合得以实现,希望成分分析和FlowPM计算工具的发展,让宇宙学以外的领域也得以受益。
相关报道:
https://blog.tensorflow.org/2020/03/simulating-universe-in-tensorflow.html
相关文章
-
Redmi官宣下个月发布RedmiK50宇宙,搭载多款高端处理器?
-
人的意义感到底从哪来?|施展札记42
-
每日一图丨疑似苹果总部被外星人入侵
-
人类是外星人试验品?太阳系这些现象无法解释
-
莫斯科物理技术学院开发出高信噪比远红外光电探测器
-
诺亚方舟遗址是真的吗?诺亚方舟遗址具体位置在哪里
-
牛鞭效应产生的原因,如何规避牛鞭效应带来的风险
-
英国时装品牌CHRISTOPHERKANE、韩国潮牌SJYP入驻京东
-
双星伴月是什么意思(两个星体和一个月亮同时被观测到)
-
海底的加州金矿之谜,屡次打捞白费无果(数量无法估量)
-
新床单不洗能直接用吗 刚买的床单使用时要注意什么
-
三星:一亿像素+骁龙865plus谁与争锋?网友:这价格不敢想!
-
三星准备推出红色版本GalaxyS20/S20+智能手机
-
赤潮是怎么形成的:海域水体的富营养化(适宜的水温和盐度)
-
外星文明想要掠夺地球,人类能获胜吗?
-
揭秘:地球被外星人暗中保护,曾阻止美核试验和登月计划
-
怎样拥有吃不胖的体质?想调理成瘦人体质该怎么做
-
银耳过夜放冰箱能吃吗 可以吃但最好别吃(可能有毒)
-
红巨星人马座kw,宇宙最大的恒星之一/可以装下10亿颗太阳
-
颈椎病有哪些症状:颈背疼痛、僵硬(一种常见的疾病)
-
黑龙江农民称和女外星人交往,孩子60年后出生,测谎仪显示没撒谎
-
星系中心黑洞与周围气体的命运共舞,科学家揭重力交互作用之谜
-
苏轼也看过UFO?五个古代记载的UFO和外星生物目击事件
-
沙雕是什么意思 沙雕可以在哪些场合当中使用
-
1626年,今北京宣武门一带发生惨重灾变(满大街碎尸/奇灾)
-
参宿七为什么是蓝色?参宿七到底有多大
-
继孙悟空之后,漫威将蚩尤设为维度魔神,伏羲剑比雷神之锤还强!
-
发现冥王星的人是谁,1930年被汤博发现(2006年冥王星降级)
-
实习标志贴在哪里 实习标志贴到底是什么意思呢