数据治理工具被定义为帮助创建和维护一组结构化策略、程序和协议的过程的工具,这些策略、程序和协议控制企业数据的存储、使用和管理方式。本文将向您介绍数据治理工具的基础知识、数据治理工具的主要功能以及 2022 年市场上可用的十大数据治理工具。
目录
一、什么是数据治理工具?
二、2022 年 10 大数据治理工具
一、什么是数据治理工具?
数据治理工具是一种帮助创建和维护一组结构化策略、程序和协议的过程的工具,这些策略、程序和协议控制企业的数据存储、使用和管理方式。
在当今的环境中,数据是每项业务的核心。可以利用维护良好的数据做出明智的业务和营销决策,使企业与竞争对手区分开来。凯捷研究实验室 2022 年的一份报告显示,39% 的参与企业高管使用数据驱动的洞察力来获得持续的竞争优势。尽管这些数字占少数,但其盈利能力提高了 22% 的显着优势。
数据驱动决策的关键是数据完整性。企业,尤其是企业,越来越多地投资于跨职能平台。基础设施可以是本地的、云端的或混合的。信息在多个应用程序和服务之间不断流动。由于系统中有如此多的数据,确保数据完整性成为一项复杂且持续的任务。这就是数据治理对任何企业都至关重要的原因。数据治理框架通常会告知和记录企业内数据的内容、人员、原因和方式。当企业数据按照预定义的规则和策略进行结构化和约束时,它会提高整个流程的一致性和可访问性。
二、2022 年 10 大数据治理工具
让我们来看看 2022 年十大数据治理工具。
1. 睿治数据治理工具
睿治数据治理工具平台是一个智能数据治理工具,可展示数据治理过程可视化视图。
1)特征
①数据治理:含数据治理九大模块。睿治智能数据治理工具由亿信华辰自主研发,融合数据集成管理、数据交换管理、实时计算存储、元数据管理、数据标准管理、数据质量管理、主数据管理、数据资产管理、数据安全管理、数据生命周期管理十大产品模块,各产品模块可独立或任意组合使用,打通数据治理各个环节,可快速满足政府、企业用户各类不同的数据治理场景。
睿治数据治理工具
②数据所有权和管理能力:允许数据所有者管理与数据相关的问题。它还允许业务词汇表批准和内置工作流。自助服务:它提供当前环境的快照视图,允许利益相关者查看何时以及为何对特定数据资产进行了更改。这有助于预测影响、解决问题并提供变更的审计跟踪。
③可视化:睿治为不同的利益相关者提供多个受控视图。它将技术数据描述映射到正确的业务上下文,以提供端到端的数据视图。它还提供系统内数据流的视觉效果。
④业务词汇表:它允许用户创建和维护业务词汇表。
⑤灵活性和兼容性:用户可以选择单独使用其中某一模块或与其他产品和解决方案一起使用。
⑥合规性审计准备:它为收集哪些数据、存储在哪里、谁可以访问它以及如何使用它提供审计就绪的透明度。数据策略管理:它允许跟踪和集中管理数据策略。
2)价格
可根据要求提供定价。也可应要求提供演示。
3)编辑评论
睿治数据治理工具十大产品模块可独立或组合使用,适应各类不同的数据治理场景应用。
2.Ataccama
Ataccama 宣称自己是一个自我驱动的数据管理和治理平台即服务 (PaaS)。它提供人工智能驱动的自动化功能,使数据管理变得容易。
1)特征
①数据编目:它使用自动数据发现来创建数据目录。
②数据管理:提供 MDM 功能。它还支持参考数据管理和数据集成。
③元数据管理:Ataccama 具有数据分析功能。
④数据所有权和管理能力:它提供基于角色的安全性,专门为数据管理员、分析师、数据工程师和数据科学家量身定制。
⑤自助服务:它通过可共享的进度报告提供整个数据集的概览。
⑥业务词汇表:Ataccama 提供业务词汇表和数据目录。
⑦灵活性和兼容性:它适用于本地、云和混合环境。Ataccama 适用于多种类型的数据存储,包括 Spark、AWS、MapR、Google 和 Azure 等大数据存储。
⑧合规审计准备:它提供了整个审计历史。
⑨数据策略管理:Ataccama 提供自动化策略执行和业务规则的自动化分配。
2)可用性
用户报告说,该平台通常需要来自 Ataccama 的顾问来进行设置、更新和部署。虽然自动化非常有利于它,但它缺乏直观的可视化部门。由于它最近收购了 Tellstory 平台,预计它会在这方面很快得到改善。
3)价格
可根据要求提供定价。如果需要,该公司提供 30 天的免费试用和演示。
4)编辑评论
Ataccama 的设计考虑了自动化驱动的企业,允许轻松扩展。它非常适合希望将数据质量、主数据管理和数据治理解决方案整合到一个工具中的企业。
3.Collibra
Collibra 是一个以企业为中心的数据治理工具,以其自动化的数据治理和管理解决方案而闻名。
1)特征
①数据编目:Collibra 有一个单独的数据目录产品,可以链接到业务词汇表和治理策略。它由机器学习提供支持,并通过已注册的数据源爬行以创建目录。
②元数据管理:Collibra 的数据目录允许用户从常用的 ERP 和 CRM 系统中发现、提取和交付元数据。
③数据所有权和管理能力:它提供管理和管理任务的自动化。
④可视化:它提供端到端的数据沿袭可视化。
⑤数据沿袭:Collibra Data Lineage 自动映射数据之间的关系,以显示数据如何在系统之间流动,以及如何构建、聚合、获取和使用数据集。
⑥业务词汇表:支持业务词汇表。
⑦灵活性和兼容性:Collibra 提供上下文搜索、直观的工作流程和数据仪表板。它提供了几个报告模板以及可定制的模板。
⑧合规审计准备:它通过跟踪数据流支持 BCBS239、GDPR、CCPA 和其他合规工作。
⑨数据策略管理:允许用户创建、查看和更新数据策略。
2)可用性
虽然用户报告了灵活性和整洁的定制服务,但他们也说界面沉重而杂乱。据报道,部署也很困难,尽管技术支持很容易获得。
3)价格
可根据要求提供定价。该公司提供免费演示。
4)编辑点评
Collibra 为企业提供了一个强大的平台来自动化数据治理。其高度可定制的特性使其成为市场上最灵活但最全面的工具之一。
4. Quest Software erwin
与 Collibra 一样,Quest 软件也提供了一系列可以驱动数据治理框架的产品。它提供 erwin 数据建模器、数据智能、数据目录、智能数据连接器和数据素养。
1)特征
①数据编目:erwin 数据目录 (erwin DC) 可根据业务需求自动化涉及收集、集成、激活和管理企业数据的流程。
②数据管理:erwin Data Intelligence (erwin DI) 结合了数据目录和数据素养。它自动从各种数据源、操作流程、业务应用程序和数据模型中收集、转换和馈送元数据到一个中央目录中。它支持数据集成和主数据管理。
③元数据管理:erwin DC 是一种元数据管理软件,可以发现数据,包括静态和动态数据。
④自助服务:它通过基于角色的上下文视图使元数据可访问和可理解,以便利益相关者可以根据准确的见解做出战略决策。erwin Data Literacy (erwin DL) 包括自助数据发现工具。
⑤可视化:erwin Data Modeler (erwin DM) 是一种数据建模工具,用于查找、可视化、设计、部署和标准化高质量的企业数据资产。
⑥数据沿袭:erwin DC 生成列级别的上游和下游数据沿袭。它涵盖了存储库、来自源系统的数据流和报告层,包括中间转换和业务逻辑。
⑦业务词汇表:erwin DL 包括业务词汇表管理。
⑧合规审计准备:它通过管理企业数据基础架构和流程来支持 IT 审计和法规遵从。
⑨数据策略管理:支持对作者的策略管理,维护和发布信息策略,结合角色和职责。它还具有规则管理器,用于定义业务词汇表术语的创建、使用和管理规则。
2)可用性
用户报告界面不是很直观。它的搜索功能似乎也在进行中。
3)价格
可根据卖家和经销商的要求提供定价。他们提供免费试用。
4)编辑点评
erwin 的数据智能是 Collibra 的一个经济实惠的替代品,它也是一个完整的数据套件。
本文转载自:https://www.gylmap.com
5. IBM
IBM 是市场上最成熟的参与者之一,其数据治理工具提供了支持多个数据治理框架的灵活性。
1)特征
①数据编目:IBM Watson Knowledge Catalog 在机器学习算法和元数据和数据资产的收获上运行。
②数据管理:IBM InfoSphere® Optim™ 解决方案管理从需求到报废的数据。
③自助服务:它为数据工程师、数据管理员、数据科学家和业务分析师提供自助服务访问。
④可视化:它提供数据配置文件可视化、内置图表和统计数据,以支持业务决策。
⑤数据沿袭:它通过自动分析和分类数据资产来跟踪数据沿袭。
⑥业务词汇表:Watson Knowledge Catalog 支持业务词汇表。
⑦灵活性和兼容性:Watson Knowledge Catalog 在 IBM Cloud™ 上有多种部署选择。
⑧合规性审计准备:它有助于 PII、PCI 和 PHI 以及 GDPR 合规性。IBM 知识加速器将行业法规和标准中的概念与业务数据保持一致。
⑨数据策略管理:支持主动策略管理。
2)可用性
用户报告说 Watson Knowledge Catalog 易于使用和浏览。但是,有报告称难以与第三方解决方案集成。
3)价格
对于 Watson Knowledge Catalog 的单独部署,请联系定价。在 IBM Cloud 上将其作为服务购买的定价基于许可证。
4)编辑评论
IBM 的 Watson Knowledge Catalog 适用于已经使用 IBM 服务且没有任何预算限制的企业。
6. Informatica
Informatica 提供最久经考验的解决方案,使业务和 IT 能够轻松协作。
1)特征
①数据编目:Informatica 自动扫描多云平台、BI 工具、ETL、第三方元数据目录和数据类型以创建数据目录。
②数据管理:它封装了主数据管理和基于人工智能的集成模式。
③元数据管理:它扫描和索引元数据。
④自助服务:Informatica 提供自助服务分析。
⑤可视化:它提供了强大的数据沿袭和历史可视化。
⑥数据沿袭:它支持自动数据沿袭跟踪。它跟踪数据移动,从高级系统视图到细粒度的列级沿袭,并获得详细的影响分析。
⑦业务词汇表:支持数据定义的业务词汇表。
⑧灵活性和兼容性:Informatica 在本地和云端使用传统和大数据源工作。
⑨合规审计准备:它打破了孤岛,让 IT、安全和业务团队参与进来,以确保数据符合 GDPR 等合规性。
⑩数据策略管理:Informatica 执行和监控数据策略。
2)可用性
Informatica 具有陡峭的学习曲线。用户报告说,该解决方案不容易部署和与其他工具集成。
3)价格
可根据要求提供定价。
4)编辑评论
Informatica 非常适合已部署 Informatica 的公司。事实上,仅使用 Axon 数据治理工具可能会很昂贵。
7. Io-Tahoe
Io-Tahoe 是一种新的数据治理工具,旨在自动化数据管理工作负载,重点关注数据质量。
1)特征
①数据编目:Io-Tahoe 具有自动数据发现以创建 SmartData 目录。
②数据管理:它在机器学习算法的帮助下识别结构化、半结构化和非结构化数据格式的关系。
③元数据管理:它分析元数据以及已知和暗数据,以提供有关端到端景观的信息。
④自助服务:Io-Tahoe 提供自助服务知识图来搜索和探索跨系统(包括 ERP、CRM、计费系统和社交媒体)的数据内容,以推动数据管道。
⑤可视化:它提供了高度自动化的数据可视化,以简化信息流。还提供了数据依赖性、异常和直观的搜索。
⑥数据沿袭:在数据发现阶段自动构建全面的数据沿袭。
⑦业务词汇表:Io-Tahoe 支持业务词汇表。
⑧灵活性和兼容性:它可以跨多个平台工作。
⑨合规审计准备:确保遵守 GDPR、Dodd-Frank 和 CCAR 等关键法规。
⑩灵活性和兼容性:它适用于 Windows、Unix、云、内部部署和 SaaS。
2)可用性
市场上相对较新,用户报告了一个简单的界面,其中有一些需要解决的问题。
3)价格
定价可根据要求提供,演示也是如此。
4)编辑点评
Io-Tahoe 非常适合数据治理目标侧重于数据发现和数据质量的企业。它的自动化和集成能力是一大优势。
8.OvalEdge
OvalEdge 是一个数据目录和治理工具。
1)特征
①数据编目:OvalEdge 使用 NLP 和 ML 使用标签、使用统计数据、用户名和自定义标签自动企业和分类数据。
②数据管理:支持数据管理和维护。
③元数据管理:它抓取所有数据源:数据湖、文件、表、分析软件等,以索引元数据。
④数据所有权和管理能力:OvalEdge 明确定义了角色和职责,包括数据所有者和数据管理员。
⑤自助服务:它生成有关数据使用和错误的报告,以提供对数据的洞察。
⑥可视化:它提供了数据关系、摘要、沿袭和索引数据的可视化表示,以便于搜索和检索。
⑦数据沿袭:它提供了沿袭的可视化表示,以显示整个生命周期。
⑧业务词汇表:支持业务词汇表。
⑨数据策略管理:OvalEdge 通过策略、控制和工作流定义数据质量规则并管理数据访问。
2)可用性
用户报告了一个易于部署的直观平台。据用户称,主要优点之一是它的可定制性。
3)价格
OvalEdge 的入门包起价为每位用户每月 100 美元,每年。
4)编辑评论
OvalEdge 非常适合寻求基于敏捷的、价格合理的解决方案的中小企业。
9. SAP
SAP 的企业主数据治理将主数据管理与数据治理相结合。
1)特征
①数据编目:支持编目创建和导入。
②数据管理:SAP Master Data Governance 在单个应用程序中支持主数据整合和中央治理场景。
③元数据管理:支持元数据管理。
④数据所有权和管理能力:MDG 提供了设置角色和职责的能力,包括数据所有者和数据管理者。
⑤可视化:MGD 提供全面、深入的数据治理视图。
⑥数据沿袭:SAP 的数据智能建模器分析和记录数据沿袭。
⑦业务词汇表:支持业务词汇表。
⑧灵活性和兼容性:它可以部署在本地或云端。
⑨数据政策管理:它能够为数据质量和治理制定政策和程序。
2)可用性
对于那些没有使用过很多 SAP 服务的人来说,界面并不直观。但是一旦跨越陡峭的学习曲线,这个数据治理工具就很容易导航了。
3)价格
SAP 为 MDG 提供两种定价选项:按域定价或涵盖多个域的基于许可的定价。可以免费试用。可应要求提供详细价格。
4)编辑点评
SAP 的 MDG 非常适合已经使用该公司其他服务的企业。除了实际的工具,用户还需要为部署和使用培训制定预算。
10.Talend
Talend 为数据治理提供统一的云平台。
1)特征
①数据编目:Talend 提供强大的搜索和发现工具。
②数据管理:Talend Data Inventory 精确定位跨数据源的数据孤岛,并突破可重用和可共享的数据资产。这反过来又与 Talend Pipeline Designer 和数据准备集成。
③元数据管理:它提供连接器以从系统内的任何数据源中提取元数据。
④数据所有权和管理能力:Talend Data Stewardship 提供基于团队的工作流来定义优先级并跟踪整个企业中数据项目的进度。数据可以被清理、认证和协调。
⑤自助服务:它通过用于分类和记录数据的自助服务应用程序消除了业务和 IT 之间的障碍。
⑥可视化:Talend Data Fabric 提供端到端的统一平台,充当所有企业数据的单一管理平台。
⑦数据沿袭:提供智能数据沿袭追踪。
⑧业务词汇表:Talend 的 Metadata Manager 支持业务词汇表。
⑨灵活性和兼容性:它可以部署在本地或云端。
⑩合规审计准备:它提供合规跟踪。
2)可用性
用户报告说 Talend 非常易于使用和部署,尽管内部版本比云版本更难部署。用户还报告说,其监控能力还有改进的余地。
3)价格
Talend 有一个免费的开源版本的产品。定价取决于功能方面的捆绑包和使用情况。付费计划起价为每月 100 美元。
4)编辑点评
Talend 专为寻求自动化和更多自助服务功能的大型企业而设计。它面向业务决策者。
综上所述
数据是新石油,听起来很陈词滥调,但事实确实如此。无论企业规模如何,增长都在于利用位于业务中心的数据。随着全球数据呈指数级增长,数据治理工具使公司能够在扩展和增长时保持数据的完整性和一致性,数据赋予决策权力,这就是为什么投资数据治理工具对各种规模的企业都至关重要。