6.1 什么是SRM问题_AB实验：科学归因与增长的利器-QQ阅读男频历史网

上QQ阅读APP看书，第一时间看更新

6.1　什么是SRM问题

SRM问题主要是指实验组和对照组之间的实验参与单元数量（比如用户数、页面数、会话数等）的比率不匹配。比如，实验设计要求将一定比例的用户暴露给这两组变量，结果应该与设计非常匹配。由于可能受实验影响，不同实验组的指标会出现差异不同，将用户暴露于不同实验组必须独立于实验处理，因此不同实验组中的用户比例应该与实验设计相匹配。

举例来说，在一个实验中，实验组和对照组分别被分配10%的用户，理想的情况是在每个组中看到大致相等的用户数，而实际结果是实验组有821588个用户，对照组有815482个用户。两者的比率是0.993，而根据实验设计比率应该是1.0。0.993的样本比率的P值为1.8×10-6（计算方法见6.3.1节），意味着在实验组和对照组具有相同用户数量的设计中，出现此比率或更极端情况的概率为1.8×10-6。于是，我们认为这属于观察到了一个极不可能发生的小概率事件。

由于小概率事件发生了，因此我们倾向于认为实验的实现过程有较大概率存在错误。因为大概率存在错误，所以不应该信任该实验的任何指标和结果。简单来说，在样本比例的P值较低，且实验样本量足够大的时候，大概率存在SRM问题，此时其他的指标也无法被信任和采用，基本都是无效的。SRM问题体现为实验组和对照组的实际比例和理论比例有所偏差，而分析基于的是理论比例，这个偏差使得分析结果失真，严重时甚至会得到完全相反的结论。

需要特别注意的是，SRM问题中用户比率采用的数量是暴露给实验的全部用户，而不是实验后续漏斗路径中的用户，漏斗用户量的差异可能是实验效果导致的，这不属于SRM问题。