博客
现代数据栈在七个关键方面改进了分析
Fivetran.
博客
现代数据栈在七个关键方面改进了分析

现代数据栈在七个关键方面改进了分析

现实世界的成功故事说明了现代数据堆栈的好处,从较低的工程成本到更大的数据素养。

杰夫Tietz,12月21日2020年

在Fivetran,我们坚定了所有尺寸的组织的现代数据堆栈(MDS)的信徒。通过抽出基础设施管理和管道维护,同时加速查询运行时,MDS将扩展您的分析功能并简化必要的数据工程。

堆栈的第一个组件,自动数据集成,无需构建和维护数据连接器或标准化数据;第二个是云数据仓库,在分离计算和存储时,可以极快的查询速度;而第三个现代商业智能工具,可以轻松可视化数据并生成可共享公司范围内共享的动态报告和仪表板。

无论您组织的大小如何,这套工具将在七个重要指标上提高您的分析程序。我们描述了下面的每一个,并从Fivetran客户提供真实的例子。

1.数据工程开销

现代数据栈可以将数据工程成本降低90%或更多,主要是通过消除构建和维护数据流水线或从非正规化API标准化数据的需要,从而降低90%或更多。预构建,完全托管数据连接器以分钟为单位启动,并将就绪数据传送到首选数据仓库或目的地。

媒体和电信公司点火组是一个很好的例子.当它希望通过集中数据来改进分析时,它的第一个选择是使用内部资源将数据引入现有的SQL Server仓库。在评估了由Fivetran和云数据仓库Snowflake支撑的现代数据堆栈后,该公司决定不走DIY路线。Ignition Group首席数字转型官Russell Stather解释道:

我们最初计划将我们的数据源带入现有的SQL Server仓库。这将使三人在两年内采取努力,并将估计有600万兰特[〜400,000美元]只是为了让我们在两个月内与Fivetran的位置。

文档认证软件提供商Docusign有类似的经验.这是商业智能高级经理Marcus Laanen的资深人们描述的工程挑战群体所面对的,以及他通过MDS的资源拯救的资源:

建立和维护数据流水线,我们需要很多人。每个来源都有自己的API和自己的怪癖。它将在三到六个月内到达高度付费的工程师,以便一周内建立数据管道,并之后最多20小时以保持运行。我们的团队将不得不加倍尺寸,以便能够做我们目前与Fivetran一起做的事情。

2.数据团队能力

现代数据栈允许您的数据团队通过增加可用数据而不会消耗内部资源来更加富有成效。Docusign再次提供了一个很好的例子。在实施MDS之前,业务依赖于手动ETL流程,并且只能集中来自六个来源的数据。Laanen表示,Docusign现在已经添加了十几个额外的来源,创造了新的分析可能性:

[我们的MDS]为我们的团队开辟了相当多的额外用例和数据来源。之前,通过将数据提取到Excel中,人们正在分析来自每个系统内的数据或本地分析。

或考虑数字投注平台足球指数,这通过实施现代数据堆栈来释放开发人员资源.选择BigQuery作为其云数据仓库后,足球指数在内部建立数据摄取脚本,因为它不想冒险在内部资源中进行延续。足球指数CTO Christophe波波夫解释说:

我知道内部构建可能会导致数据安全问题,如果出现任何问题或漏洞,那么许多活动部件将受到影响。我们实现了Fivetran,非常简单——只需要几次点击。Fivetran为我们提供了数据可靠性,并节省了10%-20%的开发时间。

3.执行新数据项目的能力

更多时间和更多数据意味着你的团队将能够专注于新的分析项目。在健身应用Strava出现之前实施了现代数据堆栈,它依赖于所有客户数据的归属合作伙伴。它使用R和Python对本地机器进行建模。

现在,除了归属合作伙伴之外,STRAVA还可以从其所有营销渠道摄取数据。它对雪花中的数据运行分析。这使得strava建立一个归因模型并进入整个客户旅程中的洞察力。正如斯特拉维亚数据科学家迈克尔·李解释道:

我们可以看出我们的付费用户是否正在与我们的社交或SEO渠道进行交互,并确定是否存在任何跨效果。使用我们的指标,我们可以确定SEO是否比我们的报酬或我们的合作伙伴营销渠道更好或更糟糕。当我们没有内部数据时,这些事情无法难以。

4.报告时间

现代数据堆栈将根本缩短报告生成时间并确保最新的报告。例如,交付优化平台引入,例如,使用现代数据堆栈来减少报告时间从五天到几个小时。数据引导Ashley Rodan描述了新的报告体验:

你可以编写SQL语句,得到漂亮的报告,你可以把它们安排到Slack和电子邮件中。它为我们提供了查询数据的速度、洞察力和灵活性,以使用过滤器和下钻来构建漂亮的报告。

媒体公司ALM提供简化报告的另一个例子.用现代数据堆栈替换手动ETL和一个预级数据库后,它能够在两天内而不是两周生成每月报告。

5.基础设施停机时间

现代数据堆栈将提高数据可靠性并消除ETL维护的负担。自动数据管道检测并响应模式和API变更而不进行人为干预,因此数据团队不必担心管道故障或数据差距。

健康品牌仪式最近实施了现代数据堆栈并用完全管理的自动化解决方案替换其脆性数据管道。虽然ETL管道经常失败,但自动化解决方案需要零维护。Ritual的数据和分析总监Brett Trani解释:

通过所有故障和数据差距,人们对数据的信任丢失并将出去并找到自己的来源 - 电子表格,广告平台,随机注释 - 并最终以相同的度量计算不同的数字。没有单一的真理来源。Fivetran优雅地处理数据源的变化。我们没有更多的数据管道故障 - 它只是有效。有时我没有登录几天或几周,因为我真的不需要触摸它。

6.数据读写

现代BI工具的直观且易于使用,旨在使企业用户和技术员工可访问数据。社交媒体营销平台Falcon.io的经验说明了对数据素养的影响

在实现现代数据堆栈之前,只有其相对小的销售运营团队常规咨询了分析。由于采用现代数据堆栈和BI工具,Falcon.IO已看到Analytics Dashboards的活动用户增加10倍。作为商业智能团队经理Nicolaas Wagenaar将其提出:

我们肯定会看到使用者增长。管理人员现在正在积极使用我们为他们设置的管道和报告。

7.绩效指标

其他数据源和易于使用的BI工具允许业务创建一系列新度量。这可能以至少两种方式发生:

  1. 更丰富的数据可以实现新的交叉分析

  2. 跨部门更大的数据访问允许更多员工根据自己的具体能力提出新的指标

Real-Estate Site Zoopla是现代数据堆栈可以在整个组织中增加战略指标的最佳示例。浮游生用MDS可靠地将其所有原始Netuite和Salesforce数据复制到云数据仓库中。然后,其数据团队使用BI工具来构建一个不断更新的40-KPI仪表板的领导团队。Zoopla Bi Steven Collings的头部描述了他的分析目标:

我们始终如一,我们不想建立一个点解决方案。我们希望确保我们正在登陆的所有数据可以用于其他目的,我们希望使这些数据以自助服务能力提供。

低码开发平台Outsystems是现代数据堆栈可以增加关键指标的第二种方式的一个很好的例子。Pre-MDS,Outsystems有15个顶级指标,并努力确保数据准确性。它的mds提供更丰富,更可靠的数据任何人都可以访问,所以每个内部部门都参与建立新的指标。OutSystems现在有50个顶级参数,而不是15个。工程主管佩德罗·马丁斯解释道:

我们的人民只能以这种方式参与,因为我们有数据可用。我们现在在这里做的任何事情都必须以某种方式量化,这是一种文化转变,为公司带来了很多价值。整个公司认为这种方式。

学习有效分析的3个原则

读博客

在几分钟内开始分析你的数据,而不是几个月

立即启动任何Fivetran连接器。