博客
每月活动行与总同步行之间的差异
Fivetran.
博客
每月活动行与总同步行之间的差异

每月活动行与总同步行之间的差异

我们认为,我们基于新的消费类定价模型,基于每月的活动行,允许我们的客户最大化价值Fivetran优惠。

经过 Sean Spediacci.,3月16日,2020年

Fivetran最近移动到基于消费的模型利用每月活跃行(MAR)。我们相信这是我们客户最大限度地提高Fivetran的价值的更好方法。这就是为什么。

积极的行和管道效率

首先,让我们定义“每月活动行”。MA的两个主要组成部分是:

  • 休息的行:休息的行是数据源中的主要键总数

  • 更新率:更新速率是在单个月内更新或至少一次添加一次的源中的主要键的百分比。这通常为10-20%。

当将行添加到数据目的地(如数据仓库)或更新该行时,该行将变为活动行。我们只在一个月的时间内将一行识别为活动的,而不是在它每次更新的时候。这意味着在一个月内对一行进行多次更新无需付费。

我们能够根据FiveTran连接器的每月基于每月的价格进行价格,以便在可能的情况下有效地捕获数据源的更改并在可能的情况下执行增量UPSERT。这最终比从典型的管道中看到的总行为小于10-100倍。这可能最终降低管理云目的地的成本,因为只需要要复制的必要数据,因此将被提出。

#总同步行和更新浪费

我们在前段时间学会了,每月活跃行与我们的客户在流水线中看到的总行为的日常活动并不相同。这是因为典型的管道将遇到浪费,这发生在未更新的行中以几种方式重复同步:

  • 多行更新:由唯一主键定义的单行可以在单个月内多次更新。行将在一个月内几次进行更新。每个更新都作为同步行计数。这通常会平均出现5倍/月。

  • 快照浪费:当实际更新的主键同步时发生这种情况(例如,使用快照复制表时)。捕获更新是艰难的,许多往往遵循快照方法,每次同步所有行。这通常会发生10-20倍/月平均每月。

在一个月的过程中,甚至几年,您可以看到典型数据流水线生成多少废物,因为它永远不会有效地处理增量变化。

计算Mar与总同步行

既然我们知道MAR和总同步行之间的区别,我们最终可以计算它们的数据量如何不同。

计算Mar:

休息的总行*更新率%= mar

要估计总的同步行数:

(平均行更新mar)+(每月快照#休息的总行)=总同步行

例子

如果我们在静止的10M行数据库中比较不同的计数会怎样?

每月活动行:

10,000,000 x 10%= 1米

总同步行:

(5.1,000,000)+(1010000000年)= 105

#Pay你使用的东西

既然你知道如何估计你的MAR以及它如何与总同步行的不同,你可以更准确地预测通过估计来使用Fivetran的价格多少学分你会需要。如果您需要帮助您的估计,请随时与产品专家设置时间!我们很乐意听到您的反馈在新模型上今天开始伙伴关系。

在几分钟内开始分析你的数据,而不是几个月

立即启动任何Fivetran连接器。