本文主要介绍下Google在RecSys 2019上的最新论文[1],提出了一套大规模多目标排序框架应用于Youtube视频推荐,引入MMoE解决多目标学习,以及解决用户隐式反馈中的selection Bias问题。
介绍
本文提出了一套大规模多目标排序框架应用于Youtube视频推荐平台。众所周知,Youtube视频推荐面临着众多的挑战,包括需要解决多个互相竞争的排序目标、以及用户反馈中的选择偏差(selection bias)等等。为了解决这些问题,我们引入了MMoE[2]来优化多目标排序目标。另外,我们改进了W & D框架来解决用户反馈的selection bias。在Youtube视频推荐的线上实验也证明了本文算法的显著提升。
所谓相互竞争的排序目标,是指在排序的优化目标上往往是相互冲突的。比如我们不仅希望用户观看,还希望用户能给出高评价并分享。所谓用户隐式反馈中的选择偏差(selection bias),具体来说比如用户点击观看视频仅仅是因为它位置比较靠前,而非用户真正喜欢。因此用当前系统收集到的数据训练出来的模型会引发bias,从而形成一个反馈循环,越来越偏。