抖音推荐机制的特征是什么( 二 )


第二步:计算每个点赞率的置信区间;
第三步:计算置信区间的下限值(wilson-s,进行排名 。这个下限值越大,排名越高 。
以下是置信区间上下限的界限:下限值最小为0,上限值最大为1
1927年,美国数学家 Edwin Bidwell Wilson提出了一个修正公式,被称为”威尔逊区间”,很好地解决了小样本的准确性问题 。
注意:公式中的在上面的公式中,表示样本的”赞成票比例”,n表示样本的大小,表示对应某个置信水平的z统计量,这是一个常数,可以通过查表或统计软件包得到 。一般情况下,在95%的置信水平下,z统计量的值为1.96 。
不难看出威尔逊置信区间的均值:(上限+下限)/2 :
可以看到,当n的值足够大时,这个下限值会趋向 。如果n非常小,这个下限值会大大小于 。实际上,起到了降低”赞成票比例”的作用,使得该类视频的得分变小、排名下降 。实际示例中也的确如此 。
这种排序算法可以消除样本数量差异太大的影响,可以适用于寻找用户兴趣爱好排序问题,进一步进行个性化方向推荐 。

几种语言的实现示例 。


推荐阅读