大数据融合
大数据服务支撑
大数据基础应用
大数据专题应用
大数据库系统
采用自主研发具有处理 PB 级别数据量能力的数据库系统,包括海贝大数据管理系统、水晶分布式数据库系统等。海贝大数据管理系统是一款基于弹性扩展架构的海量数据存储和检索系统,定位为企业级NoSQL、企业级检索平台和大数据管理集成平台;水晶分布式数据库系统是一种基于PostgreSQL的关系型数据库集群,由数个独立的数据库服务组合成的逻辑数据库,主要包括Share-Nothing无共享存储、按列式存储数据库内压缩、在线扩容、多级容错等特性。
资源整合管理系统
资源整合管理系统可将零散无序的数据通过对其进行收集、整理、去重、清洗、转换后变成标准规范的数据资源,经过数据校验和数据清理的资源将更加真实、准确、可靠,同时系统拥有可自定义的配置功能及任务管理功能,为用户提供个性化、智能化的数据整合工具及服务。
大数据质量管理系统
大数据质量管理系统以解决数据质量参差不齐、管理不善为目的。提供数据质量监控、错误质量预警、数据质量评估等功能,提供数据质量监控模型的自定义配置,利用技术监测和业务逻辑校验,进行数据源头采集、传输、应用全流程的规范性、一致性、准确性检查,实现基于不同来源数据的逻辑校验和监测管理。
大数据标准管理系统
大数据标准管理系统以解决数据标准不一、数据标准管理难等问题,遵循通用标准规范及各类业务数据标准规范,提供数据标准规则策略的自定义配置、数据元管理、数据标准管理功能。对各个系统平台流通的数据进行标准监控,合规性扫描,以保证系统运行期间数据符合标准规范,保持对数据的定义与使用的一致性,减少数据转换,促进信息资源共享。
资源编目系统
资源编目系统是大数据资源管理的基础软件,系统利用信息整理、信息加工等技术手段分门别类地组织数据资源,即通过对分散在各地区、各级部门、各专业领域的数据资源进行核查,对这些数据按照统一的标准规范进行梳理,获得对行业的业务和数据资源全面整体的认识,建立业务与数据之间的对应关系,形成一个统一的数据资源总目录,将海量无序的数据变为有序的数据资源并输出资源目录,为使用者提供数据资源发现和定位服务,实现不同部门、不同业务数据资源的共享和管理。
大数据资源监控系统
大数据资源监控系统是对平台硬件和软件资源进行全过程监控的系统,包括从服务器、网络、数据、应用和运行任务的全过程的可视化监控,为系统后台管理员和运维人员提供最简洁高效的可视化资源监控。
数据血缘管理系统
数据血缘研究的目的主要是通过数据血统追踪,在分布数据共享时可以解决数据的可信度、质量、版本信息等,对于各种导出数据集也能解决这些问题。通过数据血统追踪,根据集成视图查询数据库或数据仓库时,可以获得结果数据的来源信息。更新数据库或数据仓库中的统一视图时,反应原始数据库的变化,可以维护时空一致性。通过数据血统追踪,可以获得数据在数据流中的演化过程。