生态学研究正进入大科学、大数据时代

说起“大科学”这个词,首先让人联想到的是火箭、天文望远镜和粒子加速器的研究,这些研究需要大量的资金支撑。而生态学研究,让人联想到的是带着样方尺的植物生态学家、拿着望远镜的鸟类生态学家、以及手持捕虫网的昆虫学家等等,很少会有人将他们的研究与大科学联系起来。其实,反过来想,这又是特别令人奇怪的!生态学家研究的地区,例如大多数陆地,是一个真正被人类占领的区域,却一直没有归为大科学的范畴。不过,在David Schimel的带领下,一大邦美国生态学家们正打算纠正这种状态。他们计划将撼动陆地生态学领域,并将之引入到大科学的规模和范围,这就是他们正在建立的的美国国家生态观测网络(NEON, National Ecological Observatory Network),这也正是本文将作为详细案例进行探讨的一个话题。

“大数据”(Big Data)所覆盖的范围越来越大。例如,《纽约时报》2012年8月2日就大数据这种新出现的文化基因(cultural meme)进行了探讨。通常,人们首先以技术爱好者的角度来看待大数据。《纽约时报》的文章将大数据描述为“应用人工智能工具,如机器学习,巨大的数据的新搜集,这超越了标准的数据库。新的数据来源包括网页浏览数据的痕迹、社会网络通信、传感器数据和监测数据。”

大数据受到自然世界的塑造,并影响我们如何理解自然世界和与自然世界交流。生物学在如此多的水平上提供一个巨大的数据:来自遗传研究几乎无限的数据正充斥着我们最大的数字仓库中的字节;大量保存在自然历史博物馆的标本;在全球范围内日常生活所拍摄的摄影档案;大量的来自“公民科学”(citizen science)数据库中的数据,如国家物候学网络(National Phenology Network),有关这个内容,在2012年出版的一期的Frontiers in Ecology and the Environment中的“公民科学”栏目中有一个非常重要的综述文章“From Caprio’s lilacs to the USA National Phenology Network”介绍了这个网络;大尺度的生物地球化学作用研究的汇集,比如滨海“死亡地带”的研究,实质上是总汇了工业氮转换、人类农业实践、初级生产力和生物呼吸之间的相互作用。有关这些区域的交互式地图已经由WRI出版。

大数据正在影响我们如何理解世界,因为它正在瓦解我们在过去50年被告知的对科学理解的基石:在一个“强大的推理”框架中用受控实验来测试可证伪的假设。认为科学必须可证伪的想法来自卡尔·波普尔(Karl Popper),他从约翰·普拉特(John Platt)的传道中得到了启示,在其1964年所发表的高引用“强推论”(Strong Inference)雄文中主张用标准化方法进行生物科学研究。Observation and Ecology的作者Rafe说:“如果你第一次阅读他的文章时候就很喜欢,其实我也是这样的,但我还是劝您以批判的态度再读一遍”。并说这有点像在高中时候对艾茵·兰德(Ayn Rand)很痴迷,成年后试图用她的思想与现实结合起来。显而易见,这些哲学思想产生了一些惯例性的规则:“相关性并不意味着因果关系”、“模式不能揭示机制”,以及科学的结论如果没有推翻预先确定的假设,其作用就仅相当于“审前调查”。大数据使得以前这些坚实的信念看起来有点古怪。虽然这些信念有时候仍然有价值,但其中自反的特性被科学家和非科学家以相同的方式采用,这都需要重新评估。如果我们无法把一些机制性原因弄得100%清楚(其实没有那个方法能做到这点儿),大数据方法允许生命科学家在更大的混沌周期中发现更为健壮的模式,或者时会让我们尽可能接近真实状况。同时,在对待大数据中应该注意的是,大数据永远不会完全取代小数据。那些花时间观察自然的小数据,以及对小数据片言只语的理解,是构成大数据整体的基石。

在生态学领域,现在提起NEON,不能说是家喻户晓、人人皆知,但也可以说是在这个大数据时代增添了一道异常鲜艳的光芒。开始,这个项目仅立足于在科罗拉多的博尔德寻求资金支持,项目进展异常艰难。但是在长达十年的讨论和计划后,美国国家科学基金会设法说服国会专项拨款4.34亿美元进行建设,这是一个中等太空探测器的价格,操作预算大约为每年8千万美元。2011年美国的大陆尺度生态网络计划终于启动了,它将全面监测整个美国的环境变化,从根本上改变传统的小规模、地域性研究方式,形成陆地领域的群体合作。研究人员宣称,生态领域的大数据时代已经来临,生态观测将迎来“数据洪流”。

最终,覆盖美国的60个地区将同步建立起来。一旦在2016年这个台站网络完成后,一切顺利的话,将有15000个传感器用于收集超过500个类型的数据,包括温度、降水、气压、风速和风向、湿度、日照、如臭氧等的空气污染物浓度、土壤和溪流中各种营养的总量,以及地区的植被和微生物状态。在每个地方这些仪器将以同样的方式安装,并采用相同的测量,用标准化方式坚持长期的数据收集,希望能达到统计学功效的需求,将生态学研究从一些技巧性实验观测变成一个工业规模的企业运作。有了这样的基础,就可以观察生态系统是如何应对气候变化和土地利用变化以及新物种入侵的。最终,利用这些观测数据可开发一些预测生态系统未来的模型,这可帮助决策者评估各种行动方案所产生的后果。

图1 美国NEON项目将美国划分为20个不同的生态系统区域

NEON的研究人员将美国划分为20个不同的区域(图1),每一个区域代表一个特定的生态系统类型。每个区域都配备有三套传感器。一套固定安装在核心位点进行至少30年的连续监测,核心位点的环境条件不受干扰而且可能维持下去。其他两套可进行移动,在一个地方进行三到五年的观测后移动到其他地方,这些“浮动”的位点用于同区域内的比较。每一个位点,不管是核心位点还是浮动位点,都有一座布满传感器的观测塔,这座塔比现有的植被冠层高10米。在围绕这座塔方圆几十平方公里的区域内,研究者将更多的传感器布设在土壤和溪流中,测量温度、二氧化碳和营养水平,以及根生长速率和微生物活动。这些传感器将记录不同的生态系统如何有效地利用养分和水分,植被如何响应气候变化,以及二氧化碳在生物和大气之间是如何移动的。这将有助于寻求对碳循环的理解,以及温室气体引起的气候变化的后果。为了配合这些地面测量,研究人员还将在每个核心站点进行一年一次空中的调查,观察诸如叶化学特征和森林冠层的健康问题,也可用于与卫星观测数据进行比较。此外,NEON的研究人员可以部署一个特殊装备的飞机,其上配备了激光雷达(雷达的光学本的),一个光谱仪(测定化学成分)和一个高分辨率的相机,用于评估自然灾害如洪水、野火和害虫爆发的影响。


 

如何真正从小问题中辨别出大科学,这才是值得研究的。天文学家和物理学家们已经在这个问题上进行了数十年的探索,生物学家在人类基因组的余波中也发现这个问题。这并不是所涉及的投资巨大,而是需要处理的数据总量。过去多年来,该项目一直受到各方质疑。有人担忧NEON可能会带来大量毫无价值的数据,那些数据不一定是科学家们所需要的。组织、处理、分析这些数据并从中得出实际的意义将是一个重大挑战。哈佛大学大气化学家斯蒂文·沃夫西说:“要解决这些问题,科学家必须要学习如何利用这些数据。如果他们成功了,将给解决宏观生态问题带来实际作用。”哈勃太空望远镜在最初升空的20多年,也是产生了大量的数据。预计当NEON完全运作起来后,每年产生会200TB的数据,这是哈勃太空望远镜数据量的四倍。NEON的发展,的确代表了向“大”奋斗的生态学家的转变。毫无疑问,这将带来划时代的革命,就像天文学、物理学和遗传学变成大科学时的改变。以后,生态学家利用望远镜和捕虫网的日子是屈指可数的。但没有人怀疑,这种变化是为了更好地进行生态学研究,而且这些变化在生态学研究中正在实实在在地发生着。

如果说NEON只是美国在生态学领域开展的一个大数据项目,那么,其实在生态学领域的国际合作中,曾经产生,或目前正在产生,以及今后即将产生的大数据项目还有许多。下面仅举三个例子来说明。

由多个国家参与的国际长期生态研究项目(International Long Term Ecological Research,ILTER),支持科学家和学生进行长周期的、覆盖面广的过程研究,它涉及海洋站点、南极、市区和全球农业生态系统。ILTER科学家正致力于创造一个真实的网络,他们开始探索把许多站点连接起来的总体问题,一个根本目标是实现生态学预测。

海洋主动观测(the Ocean Observatory Initiative ,OOI)项目包括一个相互连接的海底站点区域网络。一旦建立起来,观测站将为地球和海洋科学家提供独一无二的机会,从几秒到数十年的时间尺度上研究多样的、交互过程。他们将引导区域过程和空间特征的比较研究。最终,海洋观测站将映射到整个地球并建立起基本尺度结构。

图2 ARGO计划全球浮标布设图

ARGO计划是由美国等国家大气、海洋科学家于1998年推出的一个全球海洋观测试验项目,旨在快速、准确、大范围地收集全球海洋上层的海水温、盐度剖面资料,以提高气候预报的精度,有效防御全球日益严重的气候灾害(如飓风、龙卷风、台风、冰暴、洪水和干旱等)给人类造成的威胁。 ARGO计划构想用3年至4年时间(2000年-2003年)在全球大洋中每隔300公里布放一个卫星跟踪浮标,总计为3000个,组成一个庞大的ARGO全球海洋观测网(图2)。一种称为自律式的拉格朗日环流剖面观测浮标将担当此重任。它的设计寿命为4年至5年,最大测量深度为2000米,会每隔10天至14天自动发送一组剖面实时观测数据,每年可提供多达10万个剖面的海水温度和盐度资料。ARGO全球海洋观测网建设受到了世界各沿海国家、大气科学家的青睐,被誉为“海洋观测手段的一场革命”,实现了长期、自动、实时和连续获取大范围、深层海洋资料的能力,可从根本上弥补目前天气预报中对海洋内部信息缺少了解的局面,从而会在很大程度上提高天气预报的精确度。据全球Argo实时海洋观测网透露,2012年11月4日由印度布放的编号为“2901287”的Argo浮标,收集到具有里程碑意义的第100万条观测剖面数据,标志着包括中国在内的由世界多个沿海国家共同参与的大型海洋国际合作观测计划步入了一个新的发展阶段。10年来,由美国、澳大利亚等30多个沿海国家布放的约8500个Argo浮标所组成的全球Argo实时海洋观测网,首次实现了真正意义上的对全球海洋上层温度、盐度和海流的实时观测。我国于2001年加入国际Argo计划,截至2012年11月6日,我国共计投放146个Argo浮标,获取剖面8928条,目前正在工作的浮标有85个。

Skip to toolbar