打造高校个人数据中心,夯实网上办事大厅的数据基础
发布时间:2017-06-30
来源:精华教育科技股份有限公司
作者:精华教育科技股份有限公司 4275

随着信息化的发展,高校准备搭建或已经搭建了面向师生的网上办事大厅,有效提高了学校的服务质量、服务效率,为师生办事、信息查询等提供了诸多便利。高校的网上办事大厅涉及到各个业务模块,也对各业务模块之间的数据共享能力、数据规范性等方面提出了更高的要求。因此有必要建立全校统一的个人数据中心,实现业务系统间数据的交互与共享,有效提升网上办事大厅数据应用的质量。

本文根据精华教育为周口师范学院建立“个人数据中心”过程中的经验,总结出如何高效、系统地构建高校个人数据中心,为高校网上办事大厅的应用奠定了坚实的数据基础。

一、高校网上办事大厅数据应用现状

目前高校网上服务大厅提供的诸如成绩查询、选课、教师联系方式、缴费等基础数据,无法确定其是否为权威的数据。主要原因为:各业务部门根据自己的需求,建立的是部门级别的管理信息系统,如教务系统、科研系统、人事系统、学工系统、迎新系统、图书管理系统等,这些系统间的数据大都无法共享,并且还存在诸如数据冗余、数据来源不统一等问题,使得目前高校已有的系统数据远无法满足网上服务大厅信息的综合查询需求,这种现象已成为制约高校网上服务大厅提高服务质量的瓶颈之一。

目前各业务系统间存在的主要问题是:

1、信息孤岛问题严重。各业务部门各自为政,部门间的信息无法交互和共享,形成一个个的信息孤岛。

2、没有统一的数据标准及规范。各业务系统数据的统计范围、内容、编码、格式不统一,阻碍了数据的交互和共享。

3、数据冗余,无法确定权威数据源。多个系统录入相同的数据,且各系统同步更新时间不一致,造成不同系统提供的数据不一致,也无法确定出权威的数据来源,进一步阻碍了数据的交互和共享。

4、无法应用全局性信息。数据无法交互和共享,也就无法形成全局性的数据。

二、个人数据中心的建设需求

目前网上办事大厅急需坚实的、全局的数据基础来铺垫。高校坚实的、全局的数据基础是基于人、财、物,面向特定对象的,集信息统一管理、数据分类查询及信息服务等功能为一体的各类全局性数据中心。全局性数据中心可有效实现数据的交互与共享,消灭信息孤岛、保证数据质量,为高校提供即时精准的数据。

考虑到“人”是网上办事大厅的主要服务对象,分步骤建设全局性数据中心,首先应建个人数据中心。精华教育建设的个人数据中心是面向对象的、以“人”为核心的数据中心;它以国家标准为基础,包含了所有与教职工、学生相关的数据,是一个“放之四海而皆准”的数据中心。

三、个人数据中心的建设标准

1、建立统一的数据标准,规范数据。构建标准的数据体系,确保个人数据中心的数据标准。

2、建立UC矩阵,确定数据的权威来源。建立表与字段间的UC矩阵,确保个人数据中心每个数据项都是唯一权威来源。

3、建立统一的接口,确保数据的交互。提供统一的数据查询、上传、传输接口,有效保障了数据的交互,使数据利用更便捷。

4、对数据统一管理,确保数据信息的全局性。各业务系统的数据都集中到个人数据中心,不仅便于数据的统一管理与维护,而且也确保了数据信息的全局性。

5、面向未来的可扩展性。确保未来新的个人属性、游离于各系统之外的个别数据(特别是非结构化数据)都得以存储。

四、个人数据中心的建设构架

精华教育建设的个人数据中心建设构架如图1所示,包括数据治理层、数据应用层和数据服务层。

图1 个人数据中心建设架构

数据交换平台包含数据的交换、数据的同步两个方面,它通过制订的数据交换协议及交换规则,将分散的、架构不同的、格式不一致的数据转换成集成的、可共享的、统一的数据信息。

个人数据中心与各业务系统,通过数据交换平台进行交换和共享,实现数据的正确快速流通。

个人数据中心及基于其上建立的应用集成——个人数据查询与展示平台、一表通填报平台、综合服务平台、决策支持平台、数据展示平台和数据共享平台,可有效满足学校纵深发展的需要。

五、个人数据中心的具体实施步骤

1、抽取高校各业务系统中所有与“人”相关的字段及对应的数据项。

2、检核字段异构问题,重点检核以下两类:

(1)命名冲突:分两种情况,一种是同名异义即同一字段在不同数据表中的概念不同;另一种是同义异名即不同字段在不同数据表中表述的概念相同。

(2)类型冲突:同一字段在不同数据表里面的数据类型不同。

除检核以上两类冲突外,还需检核如长度不同、精度不同、日期格式不同、默认值不同、是否允许为NULL等字段异构问题。

3、清洗不符合要求的数据:通过学号、职工号、姓名、学年、学期等多个属性匹配后,对无效值、缺失值、重复值、错误值、有冲突的值等进行清洗,过滤掉所有不符合要求的数据。

4、确定每项数据的权威来源:建立各业务系统中所有表与字段间的UC矩阵;通过对UC矩阵的正确性检验,确定每个数据项的权威来源。

5、对字段进行重新梳理和分类:字段以国家教育行业标准为基础、兼容主流信息系统、涵盖学校的个性需求;现已整理出教职工字段842个,学生字段1138个。

字段整理好后,对其重新划分,确定其对应的一级类目和二级类目:教职工个人数据中心划分为12个一级类目、63个二级类目,如图2所示:

图2 教职工个人数据中心结构

学生个人数据中心划分为8个一级类目、63个二级类目,如图3所示:

图3 学生个人数据中心结构

6、构建数据库表结构:字段明确其对应的一级类目和二级类目后,构建对应的表结构,如图4。

图4 数据库表结构

7、制订数据交换协议及交换规则:依据整理好的数据规范及标准,结合高校实际情况,制订有针对性的数据协议及交换规则。

8、对项目进行实施,具体的实施流程如下:

搭建数据库环境——搭建数据定义字典——根据数据定义字典生成库、表结构——搭建数据交换平台——实施数据初始化工作——部署数据增量交换机制——部署并实现个人数据中心信息展示系统——调试及上线运行。

9、对项目进行持续维护与升级:个人数据中心建好后,会根据业务发展及实际情况的需要,及时进行维护与升级。

六、个人数据中心在网上服务大厅的实际应用案例

个人数据中心为学校网上服务大厅提供权威的数据源,教职工和学生只需登录个人数据中心就可以查询到与自己相关的所有信息,有效地推动了学校网上服务大厅的数据应用。 

图5 个人查询界面(一对一)

图 6个人查询界面(一对多)

图7 系统查询界面

七、结束语

目前周口师范学院的个人数据中心服务平台已经基本搭建完成,它充分利用了全校现有的数据资源,真正实现了以“人”为核心的数据交互与共享,为高校网上办事大厅的数据应用奠定了重要基础。

(作者郭陶为精华教育科技股份有限公司董事长兼总经理,倪瑜琥为精华教育校联网总经理,李喜婧为精华教育校联网数据分析师。)