白话推荐系统

1,257 阅读7分钟
本账号为第四范式智能推荐产品先荐的官方账号。账号立足于计算机领域,特别是人工智能相关的前沿研究,旨在把更多与人工智能相关的知识分享给公众,从专业的角度促进公众对人工智能的理解;同时也希望为人工智能相关人员提供一个讨论、交流、学习的开放平台,从而早日让每个人都享受到人工智能创造的价值。


假设你要去外边吃火锅,你可以把家门外的所有火锅店都转悠一圈,根据价格和口味选择一家合适的店,吃完后付款离开。如果你住的地方有一家美食城,你可以根据门口的指示牌找到对应的楼层,接着按照指示到对应的火锅店,点单吃饭。如果你不想出门的话,你可以打开手机上的美食APP,在搜索框中输入“火锅”,下单付费,等待送货上门。

以上这几种情况都是在用户有明确需求的情况下,通过搜索引擎找到自己需要的东西。那么,如果用户没有明确的需求呢?比如说,某个周日的下午,你想看一部电影,但打开视频网站后,面对各种类型的电影,不知如何挑选。这时候,你有两种办法,一是咨询身边爱看电影的朋友,二是借助一个自动化工具——推荐系统

推荐系统在社交媒体中的应用


伴随着信息技术和互联网发展,人类社会已经从信息匮乏的时代步入信息过载的时代。对信息生产者和信息接收者来说,都是一件极具挑战的事:信息生产者想让自己的内容获得最大曝光,信息接收者想收到最有价值的信息。

为了解决信息过载的问题,无数的科学家提出了解决方案,其中最有代表性的要数分类目录和搜索引擎。国外著名的互联网公司雅虎凭借分类目录起家,将著名的网站分门别类整理,从而方便用户根据类别查找网站。但是随着互联网规模的不断扩大,分类目录网站也只能覆盖少量的热门网站,一些冷门、小众的网站没有办法被覆盖,这越来越不能满足用户的需求。于是,搜索引擎问世了。以谷歌为代表的搜索引擎可以让用户通过搜索关键词找到自己需要的信息,国内具有代表性的公司则是百度。

谷歌搜索界面

搜索引擎需要用户提供较为准确地关键词,因此,当用户无法准确描述自己的搜索需求时,搜索引擎就无能为力了。推荐系统的诞生很好地解决了这一问题。和搜索引擎不同的是,推荐系统不需要用户提供明确的信息需求,而是通过分析用户的历史行为并给用户的兴趣建模,主动给用户推荐他们可能感兴趣的信息。

从用户的角度来看,搜索引擎和推荐系统是用户获取信息的两种不同手段。搜索引擎满足了用户有明确目的时的主动查找需求,而推荐系统能够在用户没有明确目的的时候帮助他们发现感兴趣的新内容。无论是在互联网上,还是在现实生活中,这两种方式都大量并存,为互补关系。以在商场买东西为例,如果我们清楚地知道自己想要买什么、什么型号、什么款式、什么颜色的话,直接去店里买就好了,这就是“搜索”;如果我们不太清楚自己需要的东西的大小、型号、款式、价格等,那就需要导购来告诉我们哪一款商品符合我们的需求,这就是“推荐”。

从物品的角度来看,搜索引擎发挥的是马太效应,推荐系统则是长尾效应。

马太效应(Matthew Effect),指强者越强、弱者越弱的现象。这一理论出自圣经《新约·马太福音》一则寓言: “凡有的,还要加倍给他叫他多余;没有的,连他所有的也要夺过来”,这与“二八法则”相似,通俗来说,就叫“赢家通吃”。

以百度的搜索点击为例,越是排名靠前的搜索结果,用户越有可能点击,排名靠后的结果以及翻页后的结果被点击的可能性大大减少。这就是为什么百度的广告这么赚钱的原因,也是为什么各大公司争相做SEO的原因。排名越是靠前,被点击的可能性越大,“强者越强”。

与马太效应相对应的,则是长尾效应。美国《连线》杂志主编Chris Anderson在2004年发表了"The Long Tail"(长尾)一文并于2006年出版了《长尾理论》一书。长尾用来描述经济学中热门和冷门物品的分布情况。在互联网时代由于网络技术能以很低的成本让人们去获得更多的信息和选择,在很多网站内,有越来越多的原先被“遗忘”的冷门物品重新被人们关注起来。事实上,每一个人的品味和偏好都并非和主流人群完全一致,Chris指出:当我们发现得越多,我们就越能体会到我们需要更多的选择。

主流商品往往代表了绝大多数用户的需求,而长尾商品往往代表了一小部分用户的个性化需求。而对长尾资源的盘活和利用,恰恰是推荐系统所擅长的。用户通常对长尾内容是陌生的,无法主动搜索,只有通过推荐的方式,这些陌生的内容才能引起用户的注意,引起用户的兴趣。对生产者来说,盘活长尾资源也非常关键。试想一下,如果一个企业仅仅依靠某一类型商品来吸引人气,那么当这类商品不再受欢迎,新的商品还没有补上来的时候,企业的收益势必会受到很大波动。依靠推荐系统来充分发掘长尾,满足用户个性化、差异化的需求,让长尾内容在合适的时机曝光,吸引新的人气,才能维护企业健康稳定的运转。

那么推荐系统究竟是如何工作的呢?还是以我们的看电影为例,在决定看什么电影的时候,我们大概会经历一下几种方式:

1. 咨询身边好友。我们可以问身边爱看电影的好友,问问他们最近看过的不错的电影,或者在朋友圈坐等别人推荐。在推荐系统中,我们把这种方式叫做社会化推荐,即通过好友给自己推荐物品。

2. 从喜欢的演员或者导演入手,在搜索引擎中搜索这位演员或者导演的其他还未看过的电影。 这种方式是寻找和自己之前看过的电影在内容上相似的电影。这种方式在推荐系统中叫做基于内容的推荐。

3. 我们还可以参考豆瓣评分,结合网友打分挑选自己喜欢的电影。这种方式叫做基于协同过滤的推荐。

以上就是对推荐系统的一个简要介绍。归根究底,推荐系统就是连接用户和物品的方式之一,它能够在信息过载的环境中帮助用户找到感兴趣的东西,也能将信息推荐给真正感兴趣的用户,发挥信息的最大价值,满足不同用户群体的选择。

参考文献:

项亮. 推荐系统实践[M]. 北京:人民邮电出版社, 2012.


相关阅读:

想要了解推荐系统?看这里!(2)——神经网络方法

想要了解推荐系统?看这里!(1)——协同过滤与奇异值分解

AutoML如何实现智能推荐系统的自动上线和运维?

入门推荐系统,你不应该错过的知识清单

如欲了解更多,欢迎搜索并关注先荐微信公众号(ID:dsfsxj)