1. 二项分布(Binomial Distribution)

特点

  • 模型的是离散数据,如“点击/未点击”。
  • 适合小样本、二元结果的情况。
  • 可以直接用于显著性检验(如二项检验)。

适用场景

  • 对于转化率等二元指标直接比较时使用。
  • 当样本量不大且需要精确计算时。

优点

  • 完全适合二元事件,理论模型和实际数据一致。
  • 不需要依赖近似,结果精确。

缺点

  • 计算复杂度较高,尤其在样本量很大时。
  • 不适合连续数据。

2. 正态分布(Normal Distribution)

特点

  • 用于近似大样本下的二项分布(中心极限定理)。
  • 适用于连续指标或二元指标的近似分析。

适用场景

  • 样本量较大(通常 (n \geq 30))。
  • 关注均值的显著性差异,如点击率的均值比较。

优点

  • 计算简单,快速。
  • 适用于大样本场景,便于可视化和解释。

缺点

  • 当样本量小或数据偏离正态分布时,可能不适用。
  • 假设较强:需要数据接近正态分布。

3. t分布(t-Distribution)

特点

  • 用于小样本的均值差异分析。
  • t分布的形状取决于自由度,样本量越小,尾部越厚。

适用场景

  • 样本量小于30。
  • 比较两组均值的显著性差异。

优点

  • 适合样本量较小的数据。
  • 不完全依赖正态分布假设,允许更宽松的分析。

缺点

  • 随样本量减小,检验的统计效能降低。
  • 仅适合均值分析,不适合离散数据。

4. 泊松分布(Poisson Distribution)

特点

  • 模型的是稀疏事件的频率,如少量点击或购买。
  • 数据是非负整数,适合罕见事件。

适用场景

  • 点击/转化发生率低(例如点击率小于1%)。
  • 事件总数未知,只关注单位时间或单位流量内的发生次数。

优点

  • 更适合稀疏事件,不需要假设总样本量。
  • 计算简单,尤其在极小概率事件下。

缺点

  • 不适合高频事件。
  • 不适用于二元(成功/失败)事件建模。

5. Beta分布(Beta Distribution)

特点

  • 描述概率分布的不确定性。
  • 常用于贝叶斯方法,作为点击率的先验或后验分布。

适用场景

  • 需要基于历史数据引入先验知识。
  • 使用贝叶斯推断的A/B测试。

优点

  • 可以直接表示概率的分布,不仅是一个点估计。
  • 允许融入先验信息,适合动态调整测试策略。

缺点

  • 分析和解释需要统计背景知识。
  • 不适合频率统计中的经典显著性检验。

6. 非参数分布(如U分布、Rank Test)

特点

  • 无需对数据分布作假设。
  • 比较两组中位数或秩的显著性差异。

适用场景

  • 数据分布未知或非正态。
  • 数据存在显著离群值,均值不适合作为指标。

优点

  • 适用范围广,不依赖分布假设。
  • 对异常值敏感性低。

缺点

  • 不适用于复杂的实验设计。
  • 效率较低,尤其是样本量大时。

不同分布在A/B测试中的对比总结

分布类型适用场景优点缺点
二项分布小样本、二元事件精确计算,理论模型与数据一致计算复杂度高,不适合连续数据
正态分布大样本、连续或均值比较简单快速,适合大样本假设较强,小样本或非正态数据可能不适用
t分布小样本、均值比较适合样本量小的数据效能低,适用范围有限
泊松分布稀疏事件、低发生率更贴近低频事件,计算简单不适合高频事件
Beta分布贝叶斯方法、概率分布表示概率的不确定性,可融入先验信息分析和解释复杂,需要统计背景知识
非参数分布数据分布未知或存在离群值不依赖分布假设,对异常值敏感性低效率低,适合范围有限

选择分布的关键

  1. 样本量:样本量大时,正态分布的近似更好;小样本时使用t分布或二项分布。
  2. 数据类型:离散事件用二项或泊松分布,连续数据用正态或t分布。
  3. 事件频率:低频事件倾向于泊松分布,高频事件适合正态或二项分布。
  4. 分析需求:如果需要融入先验信息,考虑贝叶斯方法和Beta分布。

最终的选择取决于实验设计、数据特点和业务目标。