环保污染源数据中心建设的研究论文
1 引言
随着环保事业的不断发展, 环保信息化呈从单机到联网、从联网到协同的发展趋势。由于传统的环保管理模式, 早期的环保信息化主要以满足某个领域或某个部门的业务需求为主, 这样的构建方式造成了一个个分立的应用, 由于数据从属于应用, 导致数据间的孤立, 形成了一个个的信息孤岛。
为了实现跨业务和跨部门的数据应用, 需按照“集中管理、集中服务”的模式建立环保污染源数据中心, 整合覆盖环保各个环节的关键业务数据, 实现环保数据的统一交换、统一管理、统一服务和统一共享。
2 污染源数据中心的特点
实用性:环保数据中心应提供各种数据集成、报表制作、预测预警、检索查询等众多实用的功能, 从实用的角度出发, 充分考虑系统的实用性和可扩充性, 在操作方面应简单方便, 易于使用。
扩展性:环保数据中心建设是一个长期持续的过程, 在架构设计上应基于一个应用框架, 在整体应用框架下进行业务规划和系统构建, 将个性化监管业务需求和独特业务模式部署到应用框架中, 达到“可持续发展”的应用需求。
标准化:数据中心建设和运行维护涉及到的业务和技术量大面广, 需建立统一的标准规范。各类标准的执行顺序应为国际标准、国家标准、环保部标准、地方标准, 系统采用的各种框架、平台均符合国际标准。
先进性:环保污染源数据中心作为数据整合、管理和应用的核心, 应根据当前和未来发展趋势, 在设计上应采用先进的设计理念, 从数据整合、存储管理、综合分析、应用展现和数据服务等方面, 合理利用ETL、商务智能 (BI) 、数据仓库、地理信息系统 (GIS) 、门户 (PORTAL) 和内容管理 (ECM) 等技术, 构建先进的技术架构体系。
安全性:数据中心的建设应充分考虑系统安全性, 从网络安全、服务器安全、用户安全等方面出发制订安全策略, 确保信息系统安全、可靠地运行。
3 污染源数据中心建设思路
污染源数据中心作为环境污染源数据的存储中心、交换中心、管理中心和应用中心, 其总体建设思路主要包括如下几方面。
3.1 建立统一的标准规范
平台化的建设需要以统一的标准规范为基础。数据中心要实现各种污染源数据资源的整合和管理, 首先需要开展数据标准规范的建设。通过一系列数据采集、集成、存储、交换、共享和开发等标准规范, 将不同的数据资源整合到数据中心来, 并对外统一提供数据应用。
3.2 建立统一的数据资源目录
污染源数据中心的主要对象是污染源, 所有数据以污染源为核心进行关联。首先梳理所有污染源管理对象及对应的污染治理设施和排污口等部件设施, 建立污染源及期部件目录, 并统一编码。在统一目录的基础上, 梳理各个来源的数据资源, 并建立以污染源及其部件为实体的实体—属性关联关系, 最终形成污染源数据资源目录。
3.3 整合数据资源
数据整合的主要作用在于对各类业务数据进行清理、汇总、标准化和再组织。根据数据的业务意义和数据库设计规则, 梳理污染源数据, 建立数据结构和整合规则, 采用ETL等数据整合工具, 对各来源污染源数据进行抽取、转换、载入数据中心。
3.4 建立数据维护与监控平台
污染源数据存入数据中心后需要管理和维护。数据中心需具备数据监控、维护和管理的功能。通过在数据中心建立环保污染源数据管理平台, 对数据质量, 数据运行和访问情况的进行统计和监控, 对污染源数据资源进行后台管理。
3.5 建立数据服务
建立数据中心的目的就是对外提供统一的数据服务。根据数据资源目录体系和数据服务目录体系, 科学完善的组织环境数据及服务, 并在此基础上实现传统的系统间互相调用数据模式向基于应用支撑平台的一对多交换模式的转变, 实现数据资源安全有序地对外共享。
3.6 多渠道的信息发布
根据环境管理和公众需求, 拓展网站、应用系统等数据发布渠道, 将污染源数据和综合分析结果进行多渠道展示发布, 为环境管理及社会公众提供高效的环保数据。
4 污染源数据中心总体架构
数据总体架构如下图所示。
4.1 数据管理层
数据管理层是数据中心的核心资产所在, 通过数据交换平台, 遵循统一的标准规范, 将来自不同业务系统及手工采集的数据集成到污染源数据中心, 逐层构建起数据仓库, 并在此基础上形成数据资源目录。
4.2 数据服务层
数据服务层是数据资源与上端应用和展现之间的媒介, 将数据封装为服务对外提供访问, 既是上层易用性的需要, 也是下层数据安全的需要。将环保数据中心的数据服务分为通用服务、公共服务和专题服务三大类, 其中, 前两者主要面向应用系统开发, 而后者则主要面向门户展现提供服务。三类服务需形成统一的数据服务目录, 并通过企业服务总线进行服务注册, 最终实现数据共享。
4.3 数据应用层
应用层搭建在数据服务之上, 包括应用系统和门户展现两大部分。业务系统跨业务的数据访问和共享都将基于数据中心完成, 不允许系统之间直接调用。门户展现包括数据资源和数据服务的查询发布及数据的综合展现。
5 建设内容
5.1 数据资源建模建库
污染源数据建模建库主要包括公共基础数据、业务成果数据、主题数据和元数据的建模建库。公共基础数据是指污染源的编码、名称、地址等变化频次很低且各类来源数据共有的数据, 业务成果数据与公共基础数据均与污染源关联, 实现不同业务成果与同一管理对象关联。主题数据库是根据业务视角对公共基础数据、业务成果数据甚至部分重要的业务过程数据 (来自数据缓冲层) 的重新组合。元数据是对数据的描述, 是对数据的分类、组织和行为进行规范, 其作用贯穿于中心数据库的各个部分。
5.2 数据交换平台
数据交换平台主要是将各个来源的数据按照一定的规则交换到数据中心。数据交换平台应根据数据源的数据结构、存储方式、更新频次等建立数据交换规则。数据交换规则包括数据源和数据中心的指标对应, 数据编码的转换, 数据的匹配、校对和同步等。按照数据交换规则初始化并动态更新数据。数据交换平台还应对数据交换进行监控, 如数据交换日志, 异常数据告警、异常处理报告等。
5.3 数据共享服务平台
数据中心建设的核心价值在于提供数据服务。数据服务主要是综合结构化数据、GIS数据和文档数据, 为业系统提供综合数据应用, 为用户提供数据分析和信息服务, 包括数据服务接口, 统计报表、联机分析和专题分析等数据多维分析, 污染源“一源一档”等公共服务。数据共享服务平台以数据服务目录为基础, 通过平台可以对数据服务进行注册和维护管理。
5.4 数据管理平台
数据管理平台包括元数据管理, 如元数据采集、元数据修改、删除、新增等维护;公共基础数据库管理, 如公共代码管理、数据字典管理、数据资源目录管理等;业务成果数据库管理、主题数据库管理、数据采集管理、数据质量监控、数据权限监控等。
5.5 数据展现发布平台
数据可以通过门户、网站等多渠道展现发布。通过相应权限对数据进行发布、查看。数据发布包括单项业务专题数据发布、综合业务专题数据发布、业务成果数据发布、元数据发布、GIS空间数据发布、文档数据发布等。
6 结语
为适应当前环境信息化管理需求, 需通过一系列技术和管理手段, 将孤立的污染源数据进行整合, 建立污染源数据中心, 实现污染源数据的“集中管理、集中服务”。数据中心建设的前提是梳理数据资源, 建立污染源数据资源目录, 在此基础上对数据资源建模建库, 建立数据交换平台、数据服务平台、数据管理平台和数据展现发布平台。
摘要:结合我国各地环保污染源数据中心建设现状, 对环保污染源数据中心的特点及建设的思路、总体架构、和建设内容进行了研究和探讨。
关键词:环保,污染源,数据中心
参考文献
[1] 李顺, 徐富春, 孔益民, 等.国家环境数据中心建设探讨[J].环境保护, 2006 (02) :77-81.
[2] 甄欣, 曾铮.对省级环境保护信息系统建设的探讨[J].科学咨询, 2010 (10) :14-15.