1 引言
在推荐系统中一个重要的任务就是 CTR 建模,其本质的思想便是预估 user 对 item 的点击率。但是实际中获取的样本往往是在一定条件(时间、机型、位置等)下的后验结果,所以使得建模的 Label 往往是夹杂了这些因素的结果。
这些影响后验结果的因素一般称为 偏置(bias)项
,而去除这些偏置项的过程就称为 消偏(debias)
。在这其中最重要的便是 位置偏置(position bias)
,即 item 展示在不同位置会有不同的影响,且用户往往更偏向点击靠前的位置。本文将重点介绍业界在 position bias
消除上的一般做法和相关经验。
2 Position Bias
看下面的图,是笔者实际工作场景中部分位置的 CTR 趋势图。可以明显地看到:
- 呈现每 20 个 position 位一个周期;每刷请求的个数是 20.
- 周期内位置越靠前,CTR 越大;靠前效率高,用户更偏好点靠前的。