最后,计算成本主要体现在风的测量上,研究人员使用高斯过程将气球的测量结果与ECMWF的预报结果相结合,将风预报作为先验平均值。后验分布的方差量化了不同风估计的不确定性。作为控制器的输入,对气球正上方和下方的风大小和相对方位进行编码,在181个气压等级下,范围为5 kPa到14 kPa。
从2019年12月17日—2020年1月25日,Loon累计飞行了约2884小时。这些数据被划分为851个三小时时间,每个时间段作为一个独立样本。最终测试结果显示,
RL控制器在平流层内飞行的时间更长(TWR50 79%对72%;U=850, 410.5,P<10-4);高度控制使用的功率更少(29w对33w,U=1048,814,P<10-4)。
但气流是不稳定的东西。靠风在天空中移动就像使用一个道路网,在那里街道会改变方向、车道数和速度限制,甚至在不可预知的时间完全消失。
因此要做到这一点就需要一套更复杂的算法—强化学习。通过训练飞行控制器,RL可以形成一套控制策略,以处理高维的、异质的输入,并优化长期目标。比如,RL已经在Dota 2等即时策略性游戏中多次战胜人类顶级玩家,而且在长远策略方面表现惊人。
而对于一个好的飞行控制器,需要确保三点:精准且丰富和数据集,最低负载消耗以及低计算成本。
在数据集方面,研究人员根据欧洲中期天气预报中心(ECMWF)的全球再分析数据(ERA5)创建了可信的风数据集,并通过数据集的模型训练重新解释历史天气观测的结果。(ERA5提供了用程序噪声修改的基准风,通过产生高分辨率风场改变驱动程序噪声的随机种子,可以提高控制器建模误差的鲁棒性。)
在最低负载消耗方面,研究人员将部署控制器的平均功率控制在了StationSeeker之下(之前的风控制系统),同时使用奖励r对目标进行了编码。当气球距离保持在50公里范围内时,r=1为最大值。当然这种奖励也与气球的状态有关,也就是说,它的响应随时间t的变化而提供不同的指示(上升、下降或停留)
当系数小于1时,最优控制器将使未来回报的预测折现总和最大化,即“回报”。
智能教育的其中一个方面是物理环境的智能化,陈世卿院士解释道,比如说家里面的微书房,运用 AR 技术形成 3D 图像,将能更容易地进行高效率学习,甚至包括空气中的氧气含量,二氧化碳最高浓度,你的座椅环境等等,通过图像来提高学习效率。
同时,陈世卿院士还分享了另一个智能教育的应用愿景:从脑科学找到一个规律,使得从生下来到上幼儿园就可以判断出一个人是适合科学性、技术性、工程性、艺术性还是医学性的学习。“因为人的大脑学习能力和创造能力在 20 岁时处于最顶峰状态,而按照目前的教育进程,读完博士已经 35 岁了,大脑的能力已经开始处于下降状态了。”
陈世卿院士表示,按照脑科学的方法,通过 AI 赋能,改革未来的教育系统,将能够达到非常惊人的效果。他认为,加快人才释放到社会的速度,才能做到真正的不浪费人员,中国的第二次人口红利才会来。“现在第一次人口红利已经过去,社会进入到老年化阶段,用科技的方法,用脑科学的方法释放人口第二次红利,这是可以做到的。”
“现在研究的目的是什么?不是为了赚钱,而是为了让技术红利惠及所有人,解决社会经济问题。科技之道,同沾雨泽。”陈世卿院士表示,所有的人工智能应用场景都是跟人工智能有关,人工智能就是要算法,算法就需要算力,这块将来要大力开发。
