文/温淑
来源: 智东西(ID:zhidxcom)
看点:解读被苹果独占的 Dark Sky 背后技术:AI 精准预测 10 分钟后会不会下雨。
智东西 4 月 8 日消息,近期,CNN 等多家媒体报道了苹果公司对天气应用 Dark Sky 的收购,称苹果计划在 7 月前把该款 App 从安卓平台下架。这是苹果首次收购第三方天气应用。
粗略统计,仅与 iOS13 系统兼容的天气 App 就有 100 多个,苹果自家也有天气应用。在这种前提下,Dark Sky 凭借什么优势得到科技巨头苹果的青睐?被纳入到 iOS 闭环生态之中?
传统天气预报播报未来 24 小时天气,不够准确也已过时,而在开源的世界里,播报未来 10 分钟的天气变化并不是难题。
Dark Sky 正是一款以分钟级别准确预测用户所在地未来一小时降雨情况的应用。随时随地,只要用户打开应用,它会迅速基于用户定位播报天气。比如,当前地区 5 分钟后有强降雨、将持续 15 分钟等。
正如其所标榜的那样,Dark Sky 是目前“最准确的超本地化天气信息来源”App。
有趣的是,Dark Sky 并不是基于气象学方法做出天气预测,而是别出心裁地只采用了大数据分析模型。
Dark Sky 的主创团队也十分“特别”。三位创始人中,Adam Grossman 是物理学出身,Jay LaPorte 和 Jack Turner 研究计算机科学。团队其他成员则是网络开发人员和后端工程师。换句话说,整个团队都没有气象学背景。
就是这样一群半路出家的“气象工作者”,做出了这款倍受好评的天气应用。
▲Dark Sky 联合创始人:Jay LaPorte(左),Adam Grossman(中),Jack Turner(右)
01
大数据分析:剥离干扰信息,准确插值预测
据 Dark Sky 联合创始人亚当·格罗斯曼(Adam Grossman)介绍,Dark Sky 使用的雷达数据均来自美国国家海洋和大气管理局(NOAA)。
NOAA 运营着一个覆盖面极广的气象监控网络。该网络由超过 140 个雷达组成,对美国全境和一些其他地方形成了覆盖。法律规定美国公民可以免费获取这些雷达数据。
Dark Sky 团队以二进制格式下载这些数据,之后再进行必要的四步处理。
1、FANN 分离噪声和非噪声
除了有用的气象数据,雷达网络还会收集到一些噪声,比如地面反射波、虫鸟的迁徙活动和一些人类活动等。这些信息有可能被误认为是降水信号。因此,第一步要对雷达数据进行筛选。
据悉,噪声大部分由低强度数据组成(即图中浅蓝色区域)。Dark Sky 团队会先将所有低强度数据不加区分地删除。但是,除了噪声数据以外,这一步操作也移除了风暴前缘和后缘的有价值数据。而这部分丢失的数据对于预测降雨情况至关重要。
为了弥补这部分数据的丢失,Dark Sky 团队引入了 AI 技术,使用快速人工神经网络库(FANN)建立模型。
研究人员发现,噪声数据不仅是低强度的,而且具有一种可识别的“纹理”。经过大量的数据训练后,FANN 模型能够准确地识别出这种“纹理”,进而将数以千计的雷达数据分为两类:噪声和非噪声。
研究人员称训练过程需要持续一段时间,但最终得到了一个简洁、快速的程序。该模型可以识别 90~95% 的噪音,几乎没有误报。
2、CV 算法,提取风暴速度
气象系统是典型的非线性动力系统,十分混乱复杂。在进行天气预测时,要考虑到许多因素,比如复杂的流体动力学原理、地球的旋转角度、地势的不平坦情况、注入系统的太阳能等等。
这也是一个世纪以来,气象学家设计出了各种复杂模型,但仍无法提供准确天气预测的原因。
但是,Dark Sky 团队注意到,气象系统的变化在更小的时间尺度上会趋于线性。例如,在天空飘动的积云会更倾向于以相对直线运动。
当把时间尺度缩小时,降水带也会更加连贯,甚至在几分钟的时间间隔内表现为线性变化。有一些情况下,这个线性过程可以持续一个小时或更久。
为了量化这个过程,研究人员引入了计算机视觉(CV)模型。利用开源计算机视觉库 OpenCV 中的光流与目标跟踪算法,研究团队对多个雷达图像帧进行了比较,创建出了一个速度分布图。
为了使结果更加直观,研究人员用颜色替换箭头,制作出一张三通道图像。图像中,红色代表x方向的速度,蓝色代表y方向的速度,绿色代表风暴强度的变化。
3、GPU 完成预测和动画制作
研究人员会将速度图像输入 iPhone 或 iPad 上的 GPU,风暴预测过程和动画制作过程都在 GPU 中完成。
研究人员指出,由于不同风暴的特征差异、地理环境的不同等,预测结果会有所出入。例如,如果风暴更连贯和稳定,能够预测的时间就会更长。
4、误码监测
为了保证预测的准确性,Dark Sky 团队会对每一次预测进行误码监测。
据介绍,研究人员会用预测结果与实际天气情况进行对比,从而确定预测的误差有多大。此外,研究人员还会对每个雷达站进行实时检查,从而保证预测结果的准确性。
根据 ForcastWatch4 月份报道,去年一年 Dark Sky 在美国加利福尼亚州圣荷西的预报准确率达到了 80.91%,今年三月份达到 87.93%。
02
集成 GPS 定位,进行微气候调整
除了准确的预测,Dark Sky 的另一大卖点是“超本地化(Hyper-local)”。为了实现超本地化的功能,Dark Sky 需要获取用户的准确定位信息。
根据外媒 FastCompany 报道,Dark Sky 会根据地球上某个点的物理参数,对雷达图像的预测结果进行调整。这些参数包括用户所在地的海拔、坡度、到最近水域的距离、热岛效应情况等。
进行微气候调整后,预测结果会更加精准。例如,假如 GPS 信号显示用户正在湖边,预测的气温可能就会略微升高,更符合用户的体感温度。
03
宗旨:向用户呈现所有可能性
研究团队认为,大数据分析提供了一种提高天气预报准确性的手段,但是人类永远不可能 100% 地准确预测天气。为了向用户传达这种观念,Dark Sky 中的预测结果总是以百分比形式显示。
Dark Sky 联合创始人格罗斯曼认为这种显示方式提供了一定的透明度。“(以往的)天气预报缺少的最重要的东西是误差和不确定性。”他说到。
04
结语:Dark Sky 指明天气预报新思路
Dark Sky 按照大数据分析而非气象学方法来做天气预测,还集成了 GPS 定位功能,实现了在较短时间内的精准预测,由此吸引了大批受众,被称为最准确的天气预报 App。
但是,研究团队也指出 Dark Sky 的短板是无法进行较长时间范围的预测,正如创始人格罗斯曼所说:“我们的系统无法预测未来 6 个小时内的状况。”
有相关人士指出,苹果正是看中了 Dark Sky 在短时间内的精准预测能力,或将把 Dark Sky 整合到自己的天气应用中。目前苹果未就这种说法发表评论,但品牌战略家、用户体验设计师 Parker Ortolani 据此设计出了一版概念图。
参考信源:CNN,FastCompany,phoneArena,iMore,ForcastWatch