上QQ阅读APP看书,第一时间看更新
6.4.3 整合时间因素
到目前为止,我们的模型都是静态的。实际上,用户的偏好、用户对标的物的评分趋势,以及标的物的受欢迎程度都是随着时间变化的(本章参考文献[11]对怎样在协同过滤中整合时间因素有更深入的介绍)。
拿电影来说,用户可能原来喜欢爱情类电影,后面可能转而喜欢科幻类、喜剧类电影,所以我们用包含时间的pu(t)来表示用户的偏好特性向量。用户开始对某个视频偏向于打高分,经过一段时间后,用户看的电影多了起来,审美越来越挑剔,因此,我们可以用包含时间的bu(t)来表示用户偏差随着时间而变化。对于标的物偏差也一样,一个电影可能开始不是很火,但是如果它的主演后面演了一部非常火的电影,也会将原来的电影热度带到一个新的高度。比如,2019年李现演的《亲爱的,热爱的》比较火,导致李现人气高涨,他原来演的《南方有乔木》的百度搜索指数也在《亲爱的,热爱的》播出期间高涨(见图6-3)。因此,我们可以用包含时间的bv(t)来表示标的物偏差随着时间的变化而变化的趋势。我们可以认为标的物本身的特征qv是稳定的,它代表的是标的物本身的固有属性或者品质,所以不会随着时间而变化。
基于上面的分析,整合时间因素后最终的预测用户评分的公式可以表达为
整合时间因素的模型效果是非常好的,具体可以阅读本章参考文献[8]以进一步了解。
图6-3 《南方有乔木》在《亲爱的,热爱的》播出期间的百度搜索指数