Quantcast
Channel: InfoQ - 促进软件开发领域知识与创新的传播
Viewing all articles
Browse latest Browse all 1056

蘑菇街内容信息流排序实践

$
0
0

本文整理自2019年8月份举行的MOGU DDay分享算法场报告。基本涵盖了蘑菇街内容信息流排序算法一整年的关键算法迭代之路;同时我们所走的演化之路刚好契合召回、排序的各三阶段典型迭代路径。经团队审核资料可以公开,故而整理在此,期望与大家多交流。

介绍

蘑菇街的首页内容秉承为了让更多人因向往时尚而使用蘑菇街的目标,为用户提供时髦、好看、买得到的价值。下面slide中前两个图截取了我们app早期的一拖三的达人聚合内容形式,到以内容图强瀑布流的形式的变动,这种产品上的变化对我们算法和工程架构的影响还是蛮大的。第三个图就是点击内容的全屏页的效果,用户可以点赞、评论、分享,如果喜欢内容中的单品,还可以被种草而买买买,继续下滑则是可以发现更多惊喜的相关“内容推荐”。

那如何将“时髦、好看、买得到转化到我们的算法指标呢?内容社区对“时髦好看”这个基本题的解法是PUGC运营,即我街给用户呈现的都是所招募的KOL发表的、经过运营审核的、满足精选条件的内容,这与知乎、小红书等这种UGC的社区生产内容方式是不同的。

在这种模式下,内容排序算法追求的“时髦好看”,我们可以理解为Ta的内容力,也就是用户确实喜欢看并且看得多看得久。继续拆解下来,首页的基本指标就是内容点击率(ctr)和用户停留时长(dwell time)。进一步来讲就是:首页曝光pv+首页点击pv+点击二级页面停留时长。当然,业务角度考虑用户喜欢则留存、核心用户相关指标十分重要,然而这些指标一方面是中长期指标短期实验不可观测,另一方面ctr+dwell time的短期指标与中长期指标也具有一定的相关性。因此,我们与业务方沟通锚定短期指标,持续观察长期指标。


Viewing all articles
Browse latest Browse all 1056

Trending Articles