环保大数据及其在环境污染防治管理创新中的应用

全文总计 6958 字,阅读时间 18 分钟,快速浏览仅需 4 分钟。

英文标题:Big Data and Its Application in Management Innovation of Environmental Pollution Prevention and Control

内容摘要:本研究列举并分析了美国环保大数据在环境污染防治管理创新中的典型案例,在此基础上,结合我国环境污染防治实际情况,提出了环保大数据在环境污染防治管理创新中的开放、共享、标准和融合等关键点。最后对环保大数据在促进环境污染防治管理中的应用方向进行了探讨,如建设基于物联网技术的高密度监测网络,形成全区域、多方位的环境监测体系;构建大数据共享平台,实现数据融合等。

关键词:环保大数据,环境污染防治,数据共享,信息公开,管理创新

GB/T 7714-2015 格式引文:[1].环保大数据及其在环境污染防治管理创新中的应用.[J]或者报纸[N].环境保护,(20166):44-48

正文内容

  自2008年《自然》杂志提出大数据的概念以来,大数据受到了各界的强烈关注。2012年美国政府发布《大数据研究和发展计划》,将大数据研究作为国家战略,在科学发现、环境保护等领域大力开展研究;日本随后也推出“新ICT战略研究计划”,重点关注“大数据应用”。我国于2015年出台《促进大数据发展行动纲要》,将大数据上升到国家战略。“十三五”规划纲要指出,实施国家大数据战略。把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新。

  在我国,随着社会对环保的日益重视,环境信息技术在近些年也得到了飞速发展,2016年环保部发布了《生态环境大数据建设总体方案》,正在推动生态环境大数据建设和应用。环保部门开展了环境质量监测、污染源监控、生态环境调查、环境执法、环境标准、环境规划、环境统计等工作,积累了大量数据。如在大气污染防治方面,2015年我国对367个城市的空气质量进行了在线监控,对近15000家重点污染企业实行在线监控,这些污染源和环境质量等实时环境数据不断增加并逐步实现了信息的联网发布,初步具备了大数据的“4V”特性,即海量的数据规模(Volume)、快速的数据流动(Velocity)、多样的数据类型(Variety)和巨大的数据价值(Value)。本研究将重点探讨环保大数据及其在促进环境污染防治管理创新方面的应用方向。

  大数据在美国环境污染防治管理中的实践

  美国有非常成功的环境污染防治的经验,主要体现在,通过市场化的方式,通过数据的开放和共享,调动市场力量,鼓励民众广泛参与。在环保大数据方面,美国环境法研究院(Environmental Law Institute)做了一个调研,调查情况见表1。

  从这些案例可以看出,美国政府在数据开放、数据分享和公众参与方面已开展了不少工作。在数据开放方面,对于一些非敏感的数据进行开放,并且是通过“机器可读”的方式开放,这样就大大增加了数据的可重用和重用成本,真正使得这些数据“取之于民、用之于民”,促使数据产生更大的价值。在数据分享方面,政府牵头把不同组织、不同行业的数据进行分享,让数据之间的关联、碰撞产生更大价值。在公众参与方面,政府不但鼓励公众参与监督,还鼓励公众参与政府组织的数据共享(如个人气象站),这样就大大补充了政府所无法接触到的区域。美国经验对促进我国环保大数据在环境污染防治管理中的创新应用有一定借鉴意义。

  

  环保大数据促进环境污染防治管理创新的关键点

  开放:用开放的态度转变、创新思维

  要充分发挥大数据的作用和价值,就必须要用更开放的思维来拥抱大数据。以大气污染防治为例,一方面加大监测的力度,把监测的数据开放给社会,增加公众知情权,同时也要考虑把更多的数据引入环保。因此,除政府部门搭建公共空气质量平台外,通过建立适当的机制,可以引导和鼓励企业或个人监测的设备加入环保监测网络,作为官方监测的有力补充,在符合一定条件下,向公众发布。可以预见,有大量的穿戴式装备和车载空气监测设备接入到“泛空气质量监测网络”中,可以大大缓解现在空气质量监测点密度不够问题,也能解决如移动源难以监测的问题。对这些监测数据在准确度上可能有较大的差距的问题,可通过大数据的手段进行处理和提升或校正。

  共享:用共享的模式来激发创新活力

  污染防治不是一个区域、一个部门所能完成的,尤其是大气污染防治,其区域性、复合型特征日益明显,这对数据共享要求日益增大。而数据资产的优势在于,一份数据可以在非常低的成本下为多方所分享、使用,而且不减少数据拥有者的价值。在大数据时代,诚如很多专家所说,数据是“石油”一样的资源,一方面是因为其宝贵,另一方面数据要流动才会产生巨大的价值。在“互联网+”的技术和浪潮下,通过数据共享可以迅速创造更大的经济价值和社会价值。但现在很多环保数据虽然开放(在一定情况下可以通过报表等方式获取),但获取的成本很大,还没有形成长期共享、合作的机制,尚未达到真正共享的要求。

  因此,首先应该在环保部门内部打破业务、区域条线的限制,打破部门存在的“数据保护主义”,消除数据共享后对本部门、本区域的地位、利益、声誉等影响的顾虑,打破“割据”局面,创新机制和管理模式。只有数据共享,真正形成大数据,才能最大程度释放大数据的作用。

  在环保部门之外,更应建立一定的机制保证与社会、企业进行数据共享。个人、企业、社会组织也是环保创新的主体,由于大气污染成因的特殊性和专业性,他们难以承担大范围基础数据的采集成本(尤其是气象、遥感、地形及大范围高分辨率空气质量数据等)。美国政府不遗余力地将大量基础数据向社会免费共享,并且都要求数据是机器可读的,这无疑大大降低了企业和个人获取这些数据的成本。同时要求很多政府支持的科研项目成果以机器可读的方式向社会公布,做到了“政府搭台,社会/企业唱戏”,极大地释放了全社会的创新活力。

  标准:用标准规范打破创新壁垒

  环境污染防治是一种典型的跨行业、多类型的大数据综合业务应用。标准规范的不统一,使得系统和系统之间难以“对话”或“对话”的成本很高(例如要开发很多转换接口),数据难以真正流动起来。

  在我国,在环保部的组织下,已经出台了多个业务标准和规范,如《环境空气质量监测规范(试行)》《环境空气质量评价技术规范(试行)》《环境空气质量指数(AQI)技术规定》《环境空气质量预报预警方法技术指南》《大气颗粒物来源解析技术指南》等,这在一定程度上使业务标准化。

  但环保数据的标准化还面临着较大的挑战,如当前环保业务应用的数据类型多达几十种,来源于不同的数据生产部门,其组织管理的方式、标准、参考体系也各不相同,给环境大数据的快速形成与综合应用提出了挑战。不同的数据遵循了不同的数据标准,这些标准在各部门内部数据组织管理上发挥了积极作用,但它们往往划分方式不统一,尺度不统一,编码不统一,给环境大数据的跨部门检索、整合与共享带来了困难。要使得数据真正能够相互关联,实现多源异构环境大数据的一体化组织方法,打破创新壁垒,统一的数据模型和数据标准必不可少,也是现阶段环保大数据要迫切解决的瓶颈之一。在这一点上,可借鉴电力行业的公共信息模型(Common Information Model,CIM模型)。电网是世界上最大的人造网络,经过多年信息化发展,信息系统多如牛毛,复杂性可想而知。但电力行业多年的努力下,其统一的数据模型(CIM模型)日趋完善,成为智能电网的坚实基础。

  融合:用数据融合增添创新价值

  大数据不等于大量数据,也不等于很多种数据。大数据的核心在于数据之间的关联、融合,从而找出新的价值,为决策提供科学依据。大气污染防治过程中,每天会有大量的数据,以空气质量预报预警为例,就要综合气象背景场数据、地面气象观测数据、空气质量实测数据、卫星数据、交通数据等。这些数据简单放在一起,并不能给出一个科学合理的预报结果,只有通过模型(无论是数值预报模型还是统计预报模型)将这些数据融合在一起,才能得到真正预期的结果。因此,数据简单堆在一起不会创造更多价值,必须将数据与数据进行融合,才会达到1+1>2的效果,创造更大的价值。在这方面,IBM公司提出的认知计算(具备规模化学习、根据目标推理以及与人类自然互动能力的系统)是值得借鉴的一条思路。IBM针对空气污染防治提出了“绿色地平线”计划,在该计划中,系统通过认知计算整合优化各类物理、化学、气象、交通、社交等模型,再通过海量数据进行交叉印证,使模型、数据和专家经验以自动训练、自我学习的方式不断积累,从而实现精准的预报预警、溯源减排等业务的决策支持功能。

  以卫星遥感数据的融合为例,区别于现有基于专业人员主观判断的“看图说话”式的卫星数据分析方式,它可以自动识别海量的卫星数据,以机器学习的方式,将数据自动融入到模型的大数据客观分析中,对地面站点数据实现交叉验证,填补或修正地面数据在空间连续性、稳定性和准确度上的不足;另一方面,它可以动态监测各类污染源的实时变化,从而动态更新排放清单,获得更加准确的空气质量预测结果。

  环保大数据在环境污染防治管理创新中的应用方向探讨

  建设基于物联网技术的高密度监测网络,形成全区域、多方位的环境监测体系

  随着经济的高速发展、城市建设规模的不断扩大、功能区和产业结构布局的不断优化调整,在城市环境、城市建成区规模和人口数量、分布等方面都有了很大变化,因此原先的城市环境监测点已经无法准确地反映城市内环境质量的变化。为了加强对城市环境质量的监控,建设基于物联网的高密度监测网络,形成由固定监测站点、流动监测车、在线监测系统组成的全区域、全天候、多方位的环境质量监测体系,使监测数据能够更准确地反映局地污染和区域污染传输过程,提高预报准确度。通过分析环境监测的应用需求,结合物联网全面感知、可靠传递、智能控制的特征,构建基于物联网的高密度监测网络平台,提供了物联网应用所需的公共能力,如处理不同设备之间的兼容性、海量数据实时处理、设备的监控和管理等,从而构建一套稳定、可靠、安全和可扩展的网络体系。基于物联网技术的大数据环境监测体系见图1。

  

  图1 基于物联网技术的大数据环境监测体系

  构架大数据共享平台,实现不同来源数据的有机融合

  环境监测涉及的数据种类繁多,包括大气在线监测数据、污染源数据、气象数据、水质监测数据等,且每种数据分属于不同的部门单位、不同的系统,但污染的成因分析及控制措施的制定需要相关数据的综合分析利用。

  为改变数据传统的根据系统进行条块分割造成的对数据利用的限制,建立大数据共享平台,并具有数据维护管理、数据服务、数据共享功能,从而实现环境信息数据的整合和充分利用,为决策者提供360度视图,支持科学决策。为此,一是要有统一的信息资源库:实现数据维护、数据服务和数据存储管理功能,定义明确的数据管理、数据服务接口。二是要有规范的数据运维机制:严格数据的质量审核、原数据的留存、数据归档回调等,支持数据的灵活扩展(监测手段的改进、新数据源、新字段、数据精度和量纲的改变等),以及数据生命周期管理,对数据进行全方位地保护,实现分布式备份和灾难恢复。

  搭建自适应大数据处理平台,提供高性能、高可扩展性的数据服务

  随着监测设备的不断增加,系统需要管理海量的随时间变化产生的数据,要求对数据的存储也越来越长。在传统关系型数据库设计与优化理念下,通常会采用针对时间范围进行的分片技术,把大表变成较小的表。但在数据暴增的压力下,经常出现:存储空间不够了,需要采购新的存储;数据加载缓慢,一个时间点的数据尚未加载完毕,下一个时间点的数据已经等待入库;数据报表查询速度慢,严重影响系统的正常使用。

  为了实现高性能、高可扩展性的数据服务,基于大数据管理平台技术,结合Hadoop和Spark等大数据分布式处理框架,构建大数据处理平台,提供对各类观测数据、业务产品数据、辅助数据、运行支撑管理数据等结构化、半结构化和非结构化海量数据的综合管理、存储、应用数据支持,提供契合现有业务逻辑的数据服务。包括:自适应的高性能数据访问服务;实时与离线相结合的数据分析能力:可视化大数据挖掘展示。

  推进“互联网+”和新媒体技术的应用,提升公众服务质量和满意度

  现有的数据发布方式是发布者通过文字、图片、音频、视频等传播数据,向受众进行单方向的线性传播,受众被动接收信息。在发布过程中,通过发布者制定数据格式和数据内容等,无法全面考虑公众的自身需求。为了紧扣环境管理和社会公众的需求,提高公众的环保意识,提升环境监测的形象,通过推进“互联网+”和新媒体在环境监测方面的应用,将单向的线性传播转变为基于公众需求为基础的双向传播模式,结合语音识别、人工智能等技术,搭建综合性环保信息化服务平台,实现个性化、互动化和细分化的数据服务。

  线上环境监督体系:一改往昔只由政府发布数据,公众接收的模式,转为公众与政府共同参与,搭建基于微信、微博及其他手机APP等环境监测信息公众社交环境,促使环境监督与公众参与实现无缝对接。

  交互式数据分发:支持用户对环境数据内容进行自定义订阅,同时基于语音识别、人工智能和认知计算等技术,基于手机APP实现“环境保护智能小机器人”,通过交互式智能问答增加公众与环境管理部门的趣味性和互动性。

  个性化服务推送:针对不同类型、不同地域的用户进行个性化推送。其次,结合不同场景做一些定期提醒,结合时令的推广,可以提高用户的使用满意度。

  构建基于认知计算和数值模型的大气污染防治体系

  构架基于认知计算的高精度空气质量预报系统,提高预报准确度。近年来,随着大气污染问题的日益严峻,各种污染物的相互耦合叠加,大气污染现象出现了压缩性、区域性和复合型,面对大气污染的预防和控制,模型的运用越来越突显重要。但是,国内空气质量模型起步较晚,对模型的适用环境把握还不是很准确。为了提高预报准确度,构建基于认知计算的高精度空气质量预报系统,从而克服单模式的预报带来的较大误差,进一步发挥不同空气质量模式在不同气象场、不同地区、不同季节的优势。

  优化空气质量模型预报模型,有两种核心技术。预报模型自适应参数优化技术:通过分析长期数值预报模型的预报结果其与气象测量的历史真实数据作之间的关系,寻找数值模型预报偏差的统计特征,从而自适应对模型参数进行优化,改进预报结果的准确性。多模型集合预报技术:通过将两个相互独立的预测结果进行组合,其预测均方根误差可以小于单个预测的均方根误差。系统引入集合预报方法,通过输入气象场、排放源和空气质量模式关键参数的扰动构造出一组有限数量的预报样本,再通过一定的统计学方法将各个预报样本结果集合起来,在充分评估模式预报性能的基础上发挥各个模式的优点,从确定性预报转变为概率预报,提高数值预报能力,提供最优集合预报结果。

  实时分析污染物演变过程和交通污染动态排放,动态管理排放源。一方面,由于污染源的不断增加,对每一个污染源逐一进行重点监测是不现实的;另一方面,随着我国机动车数量的快速增加,交通排放已成为城市大气污染的主要来源,机动车排放的大量和VOCs等复合污染关键前体物,对城市和区域的等二次污染具有重大贡献。现有的机动车排放清单主要采用“自上而下”的方法,依靠平均化的排放因子和机动车保有量等历史统计资料获得,无法及时反映道路交通的实际情况,与实际道路排放相比,仍然存在比较大的不确定性。因此,为了及时、准确地发现污染的根源,基于数值模型源示踪和过程分析技术,对重污染过程的典型时期和条件下污染物分布及其演变规律进行实时模拟计算,分析不同重污染过程中污染物的演变规律,研究不同来源对污染物浓度的贡献,获得对于各类主要污染物的浓度、来源、去向的解析与跟踪。一方面,根据污染物的种类或者污染源的区域对不同类的污染源进行追踪,其中污染源的分类包含初始和边界条件、单独的排放类型。通过将种类和区域相结合,使对特定污染受体的分析更加系统全面。另一方面,将物理沉降过程和化学模式耦合在一起,从而更全面地反映污染物的变化及区域传输情况。

  动态地对机动车污染排放进行分析,准确评估交通控制措施对改善机动车污染排放的效果和路网改造对于机动车污染排放的影响,基于地图、人口出行等数据,实现快速、准确的交通流实时仿真,兼容多种机动车排放模型,实现交通污染排放源的动态更新,实现对机动车污染量化分析,有益于评估交通政策(发展公共交通、制定车辆管理政策等),优化交通运行,量化新道路建设、旧道路改造等举措对机动车污染排放的影响。

  基于认知计算提升大气污染防治决策支持能力,化应急管控为常态管理。在过去几年中,环保部门已经通过奥运会保障、世博会保障、“APEC蓝”等重大事件累积了丰富的大气污染应急管控经验。在这些保障工作中,专家经验、专家会商发挥了巨大的作用。如何通过认知计算把专家经验“沉淀”到系统中,让系统真正像人一样思考,提升业务单位的大气污染防治决策能力,逐渐减少对专家的依赖性,使得这些科学决策成为业务单位的常规能力,而非重大事件下专家的“特供品”。此外,在这些应急保障中,为达到良好的空气质量效果,对企业、社会采取了大量的控制措施。然而这种大规模的管控不是长久之计,这就要求在空气污染日常防治过程中,结合气象、交通等使控制措施更加精细化、更加切中要害,从而尽可能减少对经济的影响。

  因此,通过认知计算整合优化各类物理、化学、气象、交通、社交等模型,再通过大数据的方式进行交叉印证,使模型、数据和专家经验以自动训练、自我学习的方式不断积累,从而为精准预报、可靠溯源、精细减排等决策提供科学支撑。如通过精准预报未来3~7天的污染严重程度,从可靠溯源了解未来重污染各区域、各行业的贡献率,结合未来气象、交通等模型的针对不同区域、不同行业制定不同的控制措施,在重污染过去后,能够对重污染自动进行传输路径、污染成因、气象条件等系统归纳,总结评估控制措施达到的效果,形成大气污染防治的闭环管理。

参考文献

[1]中华人民共和国环境保护部数据中心[OL].http://datacenter.mep.gov.cn/.

[2]詹志明.“数字环保”到“智慧环保”——我国“智慧环保”的发展战略[J].环境保护与循环经济,2012(10):4-8.

推荐10篇