推荐系统的本质,就是从一个巨大的内容池里,给当前用户匹配出几篇感兴趣的文章。这个内容池有几十万、上百万的内容,涵盖文章、图片、小视频、问答等各种各样的体裁。

信息的匹配主要依据三个要素:用户、内容、感兴趣。

1.用户刻画

为了给用户提供他们喜欢的内容,或者理解用户的需求,平台有很多角度可以去刻画一个用户的画像,比如,年龄、性别、历史浏览的文章、环境特征等

2.内容刻画

机器提取文章中的 关键词 ,或者利用AI技术识别音频与视频的具体内容,从而将内容快速分类。

3.感兴趣

兴趣匹配:用户的阅读标签与文章标签重合度最高,被系统认定最可能对该文章感兴趣。

分批次推荐:首先会被推荐给一批对其最可能感兴趣的用户,这批用户产生的阅读数据,将对文章下一次的推荐起到决定性作用。