c语言sscanf函数的用法是什么
411
2023-03-10
本文目录一览:
考虑到劣质数据造成的财务影响,这将促使您的组织在所有相关人士、所有数据
域、所有应用程序和所有地理位置开展数据质量控制工作。
以下是有助于您在整个组织开展数据质量控制的五个主要途径:
1. 了解低劣数据质量的影响,对其进行持续监控
2. 使所有相关人士都可以参与到数据质量控制流程中
3. 不论数据域和数据用途,确保总能获得令人放心的数据
4. 部署跨所有业务应用程序,并且可以重复运用的数据质量控制规则
5. 运用一个数据集成平台
1. 了解低劣数据的影响并继续评测和监控数据质量
为避免您的公司由于劣质数据而流失客户和丧失竞争优势,您需要找出、解决和防
范数据质量问题 — 不论这些问题位于何处。
首先是探查您的数据以发现和了解数据异常和暗含的关系,而不必考虑数据自身
的复杂性或数据源之间的关系。此步骤的输出结果是元数据(有关数据说明的数
据),可用于清洗下游数据或用于未来的数据转换。凭借一个有关数据内容、质
量以及结构的完整和完全准确的视图,您可以了解劣质数据的业务影响并快速采
取修正措施。
但是,找到并修正数据质量问题并非一个一次性的项目。您需要持续评测和监控数
据质量问题。业务经理、业务分析师和数据管理员需要合适的工具,以便能够自行
定义数据规则、跟踪和监控数据质量趋势,以及发布和共享数据质量度量标准。通
过让所有合适的人员参与了解、评测、监控和最终改善数据质量,您的企业可以构
建长期并可持续开展的数据质量控制流程,从而您可以信任所有数据。
2. 使所有相关人士都可以参与到数据质量控制流程中
业务经理、数据管理员、数据分析师以及 IT 开发人员需要一个统一、基于角色,
在前端为每个角色定制并受到通用共享基础设施支持的工具集。凭借这些基于角色
的工具,所有相关人士将配有他们所需的接口和功能。由于各个角色人员均能通过
统一的基础设施与其它角色人员进行交互,因此改善数据质量的工作将变得更具有
协作性和更为优化。
· 业务经理需要易于共享、基于浏览器的记分卡,这样他们只需通过电子邮件将
URL 发给同事,即可查看并共享数据质量度量标准和报告。在他们可以了解劣质
数据对业务目标影响的时候,数据质量将直接与他们相关联。
· 数据管理员和数据分析师需要友好的用户界面、基于浏览器的探查和规则验证,
从而他们可以自行探查和分析数据、定义和监控数据质量目标、配置和运行数据
质量规则,并且不必依靠 IT 部门。
· IT 开发人员需要高生产效益的开发工具。数据探查、数据清洗和数据集成功能必
须统一,这样他们可以快速开发、优化、部署和管理可以在所有应用程序和数据
集成项目中重复使用的集中式数据质量服务。
8
3. 不论数据域和数据用途,确保总能获得令人放心的数据
适用于地址清洗和客户匹配的预建规则可生成即时可现、实实在在的价值。由于客
户数据格式和参考数据通过使用邮政地址格式和通用的词源/简写在全世界实现了
标准化,因此这些规则能够得以实现。对于可以从客户数据改善中获益的额外项
目,有能力拓展这些规则和流程尤为关键。该重复使用可产生更高的一致性并更快
为新项目产生价值。但是,仅有客户数据还不够。
对于不存在全局标准的数据域(例如,产品数据、财务数据和资产数据),您需要
有一个有效途径,以便使用定制规则和特定于公司的参考数据来实施数据质量控
制。您需要的平台应能提供构建和维护定制规则所必需的可配置能力和灵活性。
4. 部署跨所有业务应用程序,并且可以重复运用的数据质量
控制规则
业务应用程序曾一度包含用于支持数据质量的逻辑(例如,“客户名称”字段要求
提供一个名称;“出生日期”字段要求提供一个日期;“汽车注册号”字段要求提
供一个字母数字的字符组)。由于这些规则嵌在应用程序中,它们通常未被记载并
且无法重新配置。结果,这些规则无法跟上不断变化的业务需求。这些因素使得几
乎不可能在整个组织中管理数据质量或实施数据治理。
其解决方案是从应用程序中提取规则,集中管理数据质量规则,并在所有应用程序
中重复使用同样的规则。为使此途径更为高效,必须以独立于任何应用程序的形式
构建规则。通过这种方式,可以对市场营销系统、帐单开立系统、计划系统和 MDM
应用程序中的客户数据运用相同的规则。每个业务应用程序均可以请求将特定于域
的规则应用到需要这些规则的场合(例如,在将数据输入表格或批处理流程中)。
这些可重用的规则称为数据质量服务。这些服务可以通过运用数据集成技术所特有
的能力来实现:能够访问所有数据源;能够构建和共享独立于任何物理数据源的规
则和参考数据;能够支持多个请求并保证在设定的响应时间内给出结果。最典型的
数据质量服务包括探查、清洗、标准化、地址验证、匹配以及监控服务。
5. 运用一个数据集成平台
对于向所有的相关人士、项目和应用程序提供普遍深入的数据质量控制,最佳和最
为经济实惠的方式是使用数据集成平台。数据集成平台具有一个可重用的规则集和
适合管理数据质量的工具,为数据探查和数据清洗提供了单一的开发环境:
· 在所有应用程序中
· 适用于所有数据域
· 跨所有国家/地区和语言
· 适用于所有数据集成项目
凭借数据集成平台,IT 组织可以构建、集中管理和快速部署可重用的数据质量规
则。可以在所有数据集成项目中重新使用这些规则,从而极大降低成本。
数据集成平台提供可在整个企业中共享的一组协作功能和一组通用的规则和元数
据。结果,业务部门和 IT 部门的员工可以更为高效地协作,以便在几天(而不是
几月)内设计和实施满足业务需求所必需的数据规则。
数据集成平台是提供普遍深入的数据质量控制的理想基础设施,该平台可以为所有
数据服务(不论在内部预置、在合作伙伴处或在云中)提供通用连接性以及统一数
据的探查和清洗功能。
一个战略性和系统性的方法能帮助企业正确研究企业的数据质量项目,业务部门与 IT 部门的相关人员将各自具有明确角色和责任,配备正确的技术和工具,以应对数据质量控制的挑战。
Informatica 的六步法为帮助指导数据质量控制而设计,从初始的数据探查到持续监测以及持续进行的数据优化。业务部门与 IT 部门的数据使用者 — 业务分析师、数据管理员、IT 开发人员和管理员,能够在六个步骤的每一步中协同使用 Informatica 数据质量解决方案;并在整个扩展型企业的所有数据领域和应用程序中嵌入数据质量控制。
步骤一:探查数据内容、结构和异常
第一步是探查数据以发现和评估数据的内容、结构和异常。通过探查,可以识别数据的优势和弱势,帮助企业确定项目计划。一个关键目标就是明确指出数据错误和问题,例如将会给业务流程带来威胁的不一致和冗余。
步骤二:建立数据质量度量并明确目标
Informatica的数据质量解决方案为业务人员和IT人员提供了一个共同的平台建立和完善度量标准,用户可以在数据质量记分卡中跟踪度量标准的达标情况,并通过电子邮件发送URL来与相关人员随时进行共享。
步骤三:设计和实施数据质量业务规则
明确企业的数据质量规则,即,可重复使用的业务逻辑,管理如何清洗数据和解析用于支持目标应用字段和数据。业务部门和IT部门通过使用基于角色的功能,一同设计、测试、完善和实施数据质量业务规则,以达成最好的结果。
步骤四:将数据质量规则构建到数据集成过程中
Informatica Data Quality支持普遍深入的数据质量控制,使用户可以从扩展型企业中的任何位置跨任何数量的应用程序、在一个基于服务的架构中作为一项服务来执行业务规则。数据质量服务由可集中管理、独立于应用程序并可重复使用的业务规则构成,可用来执行探查、清洗、标准化、名称与地址匹配以及监测。
步骤五:检查异常并完善规则
在执行数据质量流程后,大多数记录将会被清洗和标准化,并达到企业所设定的数据质量目标。然而,无可避免,仍会存在一些没有被清洗的劣质数据,此时则需要完善控制数据质量的业务规则。Informatica Data Quality可捕获和突显数据质量异常和异常值,以便更进一步的探查和分析。
步骤六:对照目标,监测数据质量
数据质量控制不应为一次性的“边设边忘”活动。相对目标和在整个业务应用中持续监测和管理数据质量对于保持和改进高水平的数据质量性能而言是至关重要的。Informatica Data Quality包括一个记分卡工具,而仪表板和报告选项则具备更为广泛的功能,可进行动态报告以及以更具可视化的方式呈现。 上面介绍的Informatica六步法,该方法运用Informatica数据质量解决方案,提供公司所需要的各种数据质量管理能力,并确保其所有数据均是完整的、一致的、准确的、通用的。该解决方案包括几个针对特定用途优化的组件:
Informatica Data Explorer运用基于角色的工具可促进业务部门与IT部门之间的协作,该数据探查软件发现和分析任何来源中任何类型数据的内容、结构和缺陷。
Informatica Data Quality软件执行清洗、解析、标准化和匹配流程并使得可视记分卡和仪表盘上的持续监测得以进行。与Informatica data Explorer类似,它特有基于角色的工具,业务部门和IT部门可以借此得以协同工作。
Informatica Identity Resolution软件能使各机构从60多个国家/地区以及各企业和第三方应用程序中搜寻和匹配一致数据。 Informatica数据质量解决方案为业务部门与IT部门间的协作提供基础。其基于角色的工具特色设计使得业务分析师、数据管理员、IT开发人员和管理员能够充分利用数据质量控制平台他们独特的技能体系,并在流程中与所有相关人员沟通。
Informatica Analyst:适用于业务分析师和数据管理员。通过用语义术语表述数据,该款基于浏览器的工具使分析师和数据管理员能够探查数据、创建和分析质量记分卡、管理异常记录、开发和使用规则,以及与IT部门展开协作。
Informatica Developer: 适用于IT开发人员。这个基于Eclipse的开发环境允许开发人员发现、访问、分析、探查和清晰处于任何位置的数据。开发人员可以为逻辑数据对象建模,将数据质量规则与复杂转换逻辑合并,并在逻辑制定后,进行中游探查以验证和调试逻辑。
Informatica Administrator: 适用于IT管理员。该工具为IT管理员带来集中配置和管理的能力。管理员可以监测和管理安全性、用户访问、数据服务、网格和高可用性配置。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
发表评论
暂时没有评论,来抢沙发吧~