首页   新闻   公众号   更新日志   视频教程   购买积分   购买会员   购买记录      
微信新闻
本站新闻
互联网新闻

今日头条首次公布算法原理 曹欢欢谈召回策略

[ 发表时间:2018-01-15 16:55:59   ]

曹欢欢表示,今日头条有一个世界范围内比较大的在线训练推荐模型,包括几百亿特征和几十亿的向量特征。但因为头条目前的内容量非常大,加上小视频内容有千万级别,推荐系统不可能所有内容全部由模型预估。所以需要设计一些召回策略,从庞大内容中筛选一个模型组成内容库。召回策略最重要的要求是超时不能超过50毫秒。

“召回策略种类有很多,我们主要用的是倒排的思路。离线维护一个倒排,这个倒排的key可以是分类,topic,实体,来源等,排序考虑热度、新鲜度、动作等。线上召回可以迅速从倒排中根据用户兴趣标签对内容做截断,高效的从很大的内容库中筛选比较靠谱的一小部分内容。”曹欢欢解释道,“基于召回策略,把一个海量、无法把握的内容库,变成一个相对小、可以把握的内容库,再进入推荐模型。这样有效平衡了计算成本和效果。”