如何选择合适的数据治理平台?

数据治理产生竞争优势

数据治理中缺少的是统一的数据治理框架,它可以解决管理数据中最令人困惑的问题。但首先,我们必须牢记三个宏观问题,这些问题正在推动需要发现和修复三个阻碍治理成功的关键罪魁祸首。

首先,对数据洞察力的需求呈指数级增长。更多数据和对洞察力的更多需求意味着构建统一的企业数据治理框架,将所有重要的数据存储库和应用程序放在你的指尖。据福布斯报到80%的分析项目用于数据准备,从而减少了分析时间,从而减少了完成的分析项目。即使适度减少数据准备时间,也可以缩短产品上市时间,节省你的业务资金并为你提供竞争优势。关键是要构建一个统一的数据治理框架,允许你在一个简单的界面中查找所有数据和应用程序资产及其关系。

数据治理框架中的裂缝

正如大多数专业人士从他们的个人经历和计算机周刊所了解的那样还指出出现了三个常见问题,即数据治理框架出现问题 -

(1)数据沿袭,

(2)数据不完整,

(3)数据冗余。

想象一下数据治理控制台,您可以立即查看所有数据源和目标以及对此数据执行任何操作的所有应用程序,包括报告和分析?想象一下,该控制台还向您显示有关应用程序的数据转换规则,数据质量规则和操作元数据!想象一下,在为新的分析项目准备数据时,它将节省多少时间!如何识别存储有关客户的任何个人身份信息(PII)的所有数据对象?大多数企业没有这样的数据治理控制台的原因有两个简单的原因 - 如果没有自动化,实施起来既复杂又昂贵。

然而; 在我们深入研究数据治理框架中缺失的元素之前,让我们对元数据和数据质量市场有一个宏观的了解。

我们如何通过统一数据治理框架削减数据责任?

组织没有完全解决这些棘手问题(数据沿袭,数据质量和PII)的原因是因为它们很复杂且难以解决。解决它们的驱动因素也有三方面:

1、没有自动数据沿袭,devops在数据识别和准备上花费了太多时间。

2、糟糕的数据质量会降低信心并增加返工时间和上市时间,从而导致资金损失和失去机会。

3、无法检测到所有PII数据会导致违规行为受到处罚,并且会损害市场中的组织声誉。

问题是,是否有更好的方法来解决它们?

元数据困境:它很复杂,因为它很复杂 - 数据治理框架中缺少的DNA是自动化元数据提取。巨大的挑战是从复杂的SQL脚本,存储过程和其他遗留语言(如COBOL或SAS)中提取元数据并不容易实现自动化。然而,如果没有能力扫描元数据并通过源到目标之间的转换提取准确的数据沿袭,您最终会在数据沿袭中出现空白。如果没有完整的端到端数据沿袭,您将花费时间手动填补空白,从而节省您的时间和金钱。

下一代元数据:谱系提取器 - 首先,什么是谱系提取器?简单地说,这是一种基于技术的方法,该技术通过所有复杂的SQL脚本和存储过程来完成技术数据沿袭图。沿袭提取器的核心是一个自动化过程,它不仅扫描源到目标连接的元数据,还解码其间的数据转换。这是缺失的DNA,解决起来非常复杂。谱系提取器远远超出了table.column定义的扫描元数据,并解码了源和目标之间的数据转换(通常在ETL或ELT应用程序中实现)。

下一代数据沿袭:降至记录级别 - 为什么需要深入到细粒度记录级别的详细信息?这很简单 - 解决诸如GDPR之类的监管问题,记录级数据沿袭识别个人可识别数据(PII)存在的位置以及它在整个内部和外部系统中的移动方式。关键是通过自动化PII数据跟踪流程,将元数据分析利用到记录级别,以便揭示所有PII数据。

数据质量困境:根本问题始终是上游 - 每个企业都有DQ策略,各种工具实施规则,以找出质量差的数据。但在申请上游正在做什么?通常,IT通过创建测试用例,测试数据,指定预期结果,运行测试脚本,报告测试状态以及管理所有测试工件来执行手动测试。这种方法对IT来说很费力并且容易出错。传播到下游的任何错误都会影响BI分析,以及业务用户何时(只是时间问题)表面数据质量问题,除了延迟BI分析之外,它总是会导致IT重新找到并修复根本原因。问题是有更好的方法吗?我们需要的是自动化测试平台,可以根据需要自动,重复地轻松测试任何数据应用程序(ETL / ELT),并保持所有测试运行的历史记录。如果您使用敏捷开发方法,您甚至更少的时间来测试应用程序,这就变得更加重要。数据密集型应用程序的自动化测试必须成为数据质量战略的支柱。这应该集成到您的数据治理框架中。

下一代数据质量应用测试:解决上游DQ问题正面 - 很少有企业通过数据应用测试增强了他们的DQ策略。您可能想知道什么是数据应用程序测试?它只是一种自动化用于应用程序测试的典型手动方法的方法。其中一个最大的问题是,这通常是一次性或即时检查策略,使组织容易受到风险的影响。数据应用程序测试包括所有手动工作,通过支持所有类型的测试来提高运营效率 - 单元,系统和集成,回归和性能测试。最终目标是减少ETL应用程序中的时间,成本和错误。

而今,数据治理已经从国家层面开始积极建立制度标准,银行、证券等行业已成为数据治理的领先者。作为长期专注于数据全生命周期服务的提供商,亿信华辰结合多年的项目建设经验,为用户提供数据治理全栈解决方案和服务,深度挖掘数据价值,为领导决策提供支持。

全过程与全方位的数据治理

在大数据生态中可以分为采集、存储管理、应用三个阶段。在这个过程中传统数据治理也存在两个问题:第一,治理范围过窄,如果在应用过程中才发现数据的问题,那之前可能做的都是无用功,所以大数据治理要参与到整个过程中;第二,数据治理落地难,企业如果没有很好的技术平台数据治理是很难实现的,而且数据治理见效需要一定的时间。

针对数据治理的难点,必须要对大数据全过程和全方位进行管控。在多年实践的基础上,亿信华辰今年推出一站式数据治理管理平台——睿治。以元数据为基础,将数据标准、数据质量、数据集成、主数据、数据资产、数据交换、生命周期、数据安全等9个方面的产品集成至整个服务环境中,9款产品可以相互调用,也可独立使用,为整个数据治理平台提供技术支撑与保障。

图为亿信一站式数据治理管理平台架构图

亿信一站式数据治理管理平台是一款智能、敏捷的数据全生命周期的管理应用平台,打通数据治理各个环节,为企业保证了业务数据在采集、集中、转换、存储、应用整个过程中的完整性、准确性、一致性和时效性。平台具有五大特色:

第一,全行业。丰富的客户群体现了亿信的跨行业经验。

第二,全体系。通过平台、服务、规划帮助企业把数据治理落地。

第三,全框架。通过实践提炼出稳定的数据治理框架。

第四,全自主。在数据治理平台的9大产品都是自主研发。

第五,全过程。在数据的全生命周期进行治理。

最后,希望大家在2019年能够真正实现数据治理的成熟化,以及成功完成企业数字化转型。

发表评论
留言与评论(共有 0 条评论)
   
验证码:

相关文章

推荐文章

'); })();