跳过主要内容

数据集成和分析概述

下面这篇博文摘自这本书,《数据集成基本指南:如何在无限数据时代茁壮成长》.你可以买到这本书的其余部分免费在这里

分析学早于现代数据收集。克里米亚战争期间,弗洛伦斯·南丁格尔使用花花公子图确定和减少医院死亡率的原因。

资料来源:《关于影响英国军队健康、效率和医院管理问题的说明》,作者弗洛伦斯·南丁格尔。伦敦:哈里森父子公司,1858年。

在此后的几年中,现代计算和互联网的发展使得数据的收集和分析规模大大超过了使用笔、纸和制表机的可能。

今天,即使是收入不高的组织也能获得大量的数据。一个典型的商业实体、非营利组织或政府组织每年可能从各种操作系统、应用程序和设备中产生tb级的数据。这些丰富的数据为现代组织创造了前所未有的机会。

的目标分析

分析可以用来提高客户获取、留存和忠诚度;识别新的产品机会;并增加现有的机会。

一般来说,您可以通过以下方式使用分析:

  1. 专门报告。关键的利益相关者和决策者有时需要一次性或偶尔回答非常具体的问题。

  2. 商业智能。商业智能(BI)经常与“分析学”互换使用,它指的是使用可视化和数据模型来识别机会并指导业务决策和战略。这通常以定期、一致的报告和最新的仪表板的形式出现。

  3. 数据作为产品。您的组织收集或生成的数据可以以嵌入式仪表板、数据流、建议和其他数据产品的形式提供给第三方。

  4. 人工智能和机器学习。分析的顶峰是构建产品和系统,这些产品和系统使用预测建模来自动化重要的决策和过程。

知识就是力量,比竞争对手知道得多总是有利的。

分析的主要障碍:数据整合

中央记录数据存储库为组织提供了以下好处:

  1. 您可以获得组织操作的全局视图,并看到各部分如何一起工作,而不是查看竖井的、孤立的表示。

  2. 您可以在生命周期的不同阶段匹配记录并跟踪相同的实体(客户、合作伙伴等)。

  3. 您可以在与操作系统分离的环境中执行分析,从而防止查询干扰操作。

  4. 您对访问和权限进行细粒度控制,确保您的团队在不损害敏感系统的情况下获得执行工作所需的信息。

创建这个中央数据存储库可能是一项艰巨的任务。每个数据源都需要独立的过程和工具来摄取、清理和建模其数据。

最近基于云计算的应用程序和服务的激增加剧了这一挑战。

SaaS数据:不断增长的挑战和机遇

在云计算时代,SaaS应用程序已经成为业务数据的主要来源之一。SaaS应用跨越了一系列运营和行业:营销、支付处理、客户关系管理、电子商务、工程项目管理等等。SaaS应用程序通常记录用户的操作,为组织提供他们的操作的高粒度图片,从中推断模式和因果关系。一般来说,你能量化和分析的业务方面越多,你的竞争力就越强。

一个典型的公司现在使用超过100款应用.在这种规模下,手动数据集成几乎是不可能的。

繁重的工作让分析师、数据科学家和工程师无暇顾及其他活动。

幸运的是,云技术为这一挑战提供了解决方案。现代数据管道工具、数据仓库和商业智能平台本身就是基于云的应用程序,它们与云技术一起激增。它们有效地消除了手动开发定制的、内部的数据集成和分析工具和解决方案的需要。

阅读有关数据集成的方法在这里

以上摘录自《数据集成基本指南:如何在无限数据时代茁壮成长》.这本书涵盖的主题包括数据集成如何促进分析,从ETL到ELT到自动数据集成的演变,自动数据集成的好处,以及如何评估数据集成提供商的技巧。今天就可以免费获得指南: