数据治理工具

网友投稿 328 2022-11-25

数据治理工具

Data Governance Tools - Evaluation Criteria, Big Data Governance,

内容:

前言

第一部分:导论:

1:数据治量简介

定义

案例分析

数据治理的支柱

摘要

2:企业数据管理参考架构

EDM类别

大数据

数据治理工具

摘要

第二部分:数据管理工具的数据

3:商业词汇表

Excel,CSV或XML格式的批量加载业务术语

创建业务术语类别

促进社会协作

自动超链接嵌入式商业条款

将自定义属性添加到业务术语和其他数据工件

将自定义关系添加到业务术语和其他数据工件

将自定义角色添加到业务术语和其他数据工件

将业务术语和列名称链接到关联的参考数据

将业务术语链接到技术元数据

支持创建自定义资产类型

标记关键数据元素

提供OOTB和自定义工作流来管理业务条款和其他数据工件

查看业务术语和其他数据工件的更改历史记录

允许业务用户直接从报告工具链接到词汇表

搜索商业条款

将业务术语与关联的非结构化数据集成

摘要

4:元数据管理

从数据建模工具中提取逻辑模型

从数据建模工具中提取物理模型

从关系数据库中提取元数据

从数据仓库设备中提取元数据

集成传统数据源中的元数据

从ETL工具中提取元数据

从报告工具中提取元数据

在元数据工具中反映自定义代码

从分析工具中提取元数据

将业务术语与列名相关联

从数据质量工具中提取元数据

从大数据源中提取元数据

提供有关数据沿袭的详细视图

自定义数据沿袭报告

管理元数据存储库中的权限

支持在元数据存储库中搜索资产

摘要

5:数据分析

进行柱分析

发现列的值分布

发现列的模式分布

发现列的长度频率

发现隐藏的敏感数据

发现列中具有相似声音的值

同意数据治理计划的数据质量维度

制定与数据质量维度相关的业务规则

与数据质量完整性维度相关的配置文件数据

与数据质量一致性维度相关的配置文件数据

与数据质量一致性维度相关的概况数据

与数据质量同步维度相关的配置文件数据

与数据质量唯一性维度相关的配置文件数据

与数据质量的及时性维度相关的概况数据

发现跨列的数据重叠

发现列之间的隐藏关系

发现依赖关系

发现数据转换

创建可以分析的虚拟联接或逻辑数据对象

摘要

6:数据质量管理

将数据转换为标准格式

提高地址数据的质量

匹配并合并重复记录

创建数据质量记分卡

选择数据域或实体

定义数据质量的可接受阈值

选择要为特定数据域或实体测量的数据质量维度

选择每个数据质量维度的权重

选择每个数据质量维度的业务规则

为给定数据质量维度中的每个业务规则分配权重

将业务规则绑定到相关列

查看数据质量记分卡

突出显示与较差数据质量相关的财务影响

进行时间序列分析

管理数据质量例外

摘要

7:主数据管理

定义MDM Hub消耗的业务术语

管理实体关系管理

主数据丰富规则

管理主数据验证规则

管理记录匹配规则

管理记录合并规则

查看杰出数据管理任务列表

管理重复项

查看数据管理仪表板

管理层次结构

提高主数据质量

将社交媒体与MDM集成

管理主数据工作流程

比较主数据的快照

提供主数据更改历史记录

将MDM任务卸载到Hadoop以加快处理速度

摘要

8:参考数据管理

建立代码表清单

同意每个代码表的主值列表

在主值和相关CodeTable之间构建简单映射

在代码值之间构建复杂映射

管理代码值的层次结构

构建和比较参考数据的快照

可视化参考数据快照之间的跨时间交叉验证

摘要

9:信息政策管理

管理业务术语表中的信息策略,标准和流程

管理业务规则

利用数据治理工具监控和报告合规性

管理数据问题

摘要

第三部分:企业数据管理与数据工具之间的整合

10:数据建模:将逻辑和物理数据模型与元数据存储库集成

在元数据存储库中公开本体

使用数据发现工具对跨数据域的统一模式进行原型设计

建立数据模型以支持主数据管理摘要

11:数据集成:使用数据集成以集成方式部署数据质量作业

在MDM或参考数据中心与源系统之间移动数据

利用数据集成工具使用的参考数据

将数据集成工具集成到元数据存储库中

通过利用元数据存储库自动生成数据集成作业

摘要

12:分析和报告

将数据分析结果导出到报告工具以进行进一步的可视化分析

将数据工件导出到报表工具以实现数据治理指标的可视化

将分析和报告工具与语义上下文的业务术语表集成

摘要

13:业务流程管理

数据治理工作流应该利用BPM功能

主数据工作流应该利用BPM功能

数据治理工具应映射到BPM工具

摘要

14:数据安全和隐私

确定隐私义务

使用数据发现工具发现敏感数据

标记元数据存储库中的敏感数据

在生产环境中屏蔽敏感数据

掩盖非生产环境中的敏感数据

监视特权用户的数据库访问

文档信息策略由数据屏蔽和数据库监视工具实现

使用数据屏蔽工具可以执行的数据发现工具创建完整的业务对象

摘要

15:信息生命周期管理

ILM工具实现的业务术语表中的文档信息策略

发现可以通过ILM工具高效执行的完整业务对象

摘要

第四部分:大数据治理工具

16:Hadoop和NoSQL

在Hadoop中执行数据清单

在Hadoop中分配数据的所有权

在Hadoop中为Analytics提供语义层

查看Hadoop内外数据的沿袭

管理Hadoop的参考数据

在Hadoop中本地配置数据

在Hadoop中本地发现数据

在Hadoop中本地执行数据质量规则

将Hadoop与主数据管理集成

Hadoop的端口数据治理工具可提高性能

管理NoSQL数据库中的数据

在Hadoop中屏蔽敏感数据

摘要

17:流计算

使用数据分析工具来理解输入数据的样本集

管理流计算应用程序使用的参考数据

管理流计算应用程序使用的业务术语

摘要

18:文本分析

大数据治理降低充血性心力衰竭患者的再入院率

利用非结构化数据提高稀疏性质量

填充结构化数据

提取结构化数据中不可用的其他相关预测变量

为关键业务术语定义一致的定义

确保设施中患者主数据的一致性

遵守隐私要求

管理参考数据

摘要

第五部分 - 评估标准和供应商景观

19:数据治理平台的评估标准

总拥有成本

数据管理

审批工作流程

数据工件的层次结构

数据治理指标

云端

摘要

20:ASG

ASG- metaGlossary

ASG-Rochade

ASG-becubic

21:Collibra

商业词汇表

参考数据管理

数据管理

工作流程

元数据

数据分析

22:全球ID

数据分析

数据质量

元数据

23:IBM

元数据

信息集成

数据质量

主数据管理

数据生命周期管理

隐私和安全

24:Informatica

数据分析和数据质量

元数据和业务术语表

主数据管理

信息生命周期管理

安全和隐私云

25:Orchestra Networks

工作流数据建模

主数据管理

参考数据管理

商业词汇表

26:SAP

内存数据库数据

质量和元数据管理

主数据管理

内容管理

信息生命周期管理

企业建模

数据集成

27:Talend

扩展生态系统

大数据

数据集成

数据质量

主数据管理

企业服务总线(ESB)

业务流程管理(BPM)

28: 着名的供应商

Adaptive

BackOffice Associates

Data Advantage Group

Diaku

Embarcadero Technologies

Global Data Excellence

Harte-Hanks Trillium

Oracle

SAS

附录A:缩略语列表

附录B:术语表

附录C:使用工具自动执行的潜在数据治理任务

商业词汇表

元数据管理

数据分析

数据质量管理

主数据管理

参考数据管理

信息政策管理

数据建模数据集成

分析和报告

业务流程管理

数据安全和隐私

信息生命周期管理

Hadoop和NoSQL

流计算

文本分析

索引

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:HDFS commands
下一篇:一分四串口UART扩展芯片的特性
相关文章

 发表评论

暂时没有评论,来抢沙发吧~