seo是网站搜索引擎上的优化(推荐系统和推荐的区别和相似的地方有哪些?)
优采云 发布时间: 2022-04-11 04:21seo是网站搜索引擎上的优化(推荐系统和推荐的区别和相似的地方有哪些?)
seo优化中推荐系统与搜索引擎的关系,从信息获取的角度来看,搜索和推荐是用户获取信息的两个主要手段。无论是线上还是线下,搜索和推荐两种方式大量并存,那么推荐系统和搜索引擎是什么关系呢?有什么不同和相似之处?海耀seo工程师对两者的关系进行了阐述,并分析了异同。
主动或被动:搜索引擎和推荐系统的选择
图 1:搜索引擎和推荐系统是获取信息的两种不同方式
获取信息是人类认识世界、生存和发展的刚需。搜索是最确定的方式。它所体现的动作是“出去找”,找食物、找地方等。在互联网时代,搜索引擎是满足找信息需求的最佳工具,你输入你想找的内容(即也就是,在搜索框中输入查询词,或者Query),搜索引擎很快就会给你最好的结果。这种刚需催生了谷歌、百度等互联网巨头。
但是,除了搜索之外,还有另一种获取信息的方式,这就是推荐系统(Recommendation System,简称Recsys)。推荐也是伴随人类发展的一项基本技能。你一定会遇到这样的场景。在地方,我会请当地朋友问“嘿,请推荐附近有什么好吃好玩的地方!” - 知识、信息等通过推荐传播,也是一种获取信息的方式。
搜索和推荐的区别如图1所示。搜索是一种非常主动的行为,用户的需求非常明确。在搜索引擎提供的结果中,用户也可以通过浏览和点击来明确判断是否满足用户的需求。. 然而,推荐系统被动接受信息,要求模糊不清。以“逛逛”商场为例,当用户进入商场时,如果他们的需求不明确,此时需要一个推荐系统来告诉用户有哪些优质的产品和合适的内容,但如果用户很清楚他们需要购买什么品牌和型号的产品,直接去对应的店铺,然后就可以搜索了。
图2:从搜索词可以看出,用户对个性化推荐的需求很大
许多互联网产品需要同时满足用户的两种需求。例如,提供音乐、新闻或电子商务服务的 网站 必须提供搜索功能。当用户要查找某首歌或某件商品时,可以通过输入名称进行搜索;同时,它还提供了推荐功能。当用户只是想听一首好歌,或者打发时间看新闻,但又不知道该听哪首歌,就够了。改善用户体验的建议。
个性化水平
除了主动和被动之外,另一个有趣的区别是个性化水平。虽然搜索引擎也可以有一定程度的个性化,但是个性化操作的整体空间比较小。因为当需求非常明确的时候,往往在寻找好坏结果方面并没有太大的个人差异。比如搜索“天气”,搜索引擎可以补充用户所在地区的信息,给出当地天气的结果,但是个性化补充后给出的结果也一目了然。
然而,推荐系统有更多的个性化空间。以“推荐一部好电影”为例。100 个用户有 100 种口味,没有“标准”答案。用户的历史观看行为、评分记录等产生对当前用户最有价值的结果,这也是推荐系统的独特魅力。虽然推荐的类型很多(如相关推荐、个性化推荐等),但个性化对于推荐系统来说是如此重要,以至于在很多情况下,人们将推荐系统简单地称为“个性化推荐”甚至“智能推荐”。.
快速满足还是持续服务?
开发过搜索引擎的朋友都知道,评价搜索结果质量的一个重要考虑因素是帮助用户尽快找到自己需要的结果并点击离开。在设计搜索排名算法时,我们需要尽最大努力将最好的结果排在首位。通常,搜索引擎的前三个结果会采集绝大多数用户点击。简单来说,一个“好”的搜索算法需要用户更高效地获取信息,停留时间更短。
但推荐恰恰相反。推荐算法与推荐内容(如产品、新闻等)往往紧密结合,用户获得推荐结果的过程可以是连续的、长期的。衡量推荐系统是否足够好,往往需要根据用户是否能停留更长时间(如购买更多产品、阅读更多新闻等),对用户兴趣的探索越深,越能“了解“用户,推荐的成功率越高,用户的可能性就越大。越愿意留在产品中。
因此,对于大量基于内容的应用来说,构建优秀的推荐系统是提升性能必须重视的手段。
推荐系统满足难以用语言表达的需求
目前主流的搜索引擎仍然使用词来组成查询词(Query),因为词是人们描述需求的最简洁直接的方式,而且搜索引擎抓取和索引的大部分内容也是用词组织的.
因为这个因素,我们发现用户输入的大部分搜索查询词都比较短,收录5个以下元素(或词条)的查询词占总查询量的98%以上(例如:查询“乐观数据地址”,其中收录“乐观数据”和“地址”两个元素)。
但另一方面,用户有大量难以用精致词组织的需求,比如想找“我附近的四川饭店,价格不到100元”,“我要找的衣服”在“其他款式相同但价格更优惠的裙子”等。
一方面,几乎没有用户愿意输入这么多词来查找结果(用户自然愿意偷懒),另一方面,搜索引擎对语义的理解还不够深入;所以在满足这些需求时,推荐系统设置的功能(如页面设置的“相关推荐”、“猜你喜欢”等模块),加上与用户的交互(如过滤、排序、点击等),不断积累和挖掘用户的喜好,可以很好地满足难以用语言表达的需求。
从视觉上看,推荐引擎也被称为静默搜索,即虽然用户不需要主动输入查询词进行搜索,但推荐引擎通过分析用户的历史行为和当前的上下文场景,自动生成复杂的查询。条件,然后给出计算和推荐的结果。
马太效应和长尾理论
马特纽效应是指强者愈强,弱者愈弱的现象。在互联网上流行的产品会受到更多关注,而冷门的内容会越来越被遗忘。马太效应得名于圣经《新约马太福音》中的一个比喻:“凡有的,将加倍加倍,使他多余;谁一无所有,连他所有的也将被夺走。”
搜索引擎充分体现了马太效应——比如下面的谷歌点击热度图,越红的部分表示点击多且热,越紫色的部分表示点击少且冷,大部分用户的点击集中。在顶部的少量结果中,下面的结果以及翻页结果很少受到关注。这也解释了为什么谷歌和百度的广告利润如此之高,以及为什么企业客户在搜索引擎优化或搜索引擎优化上花费大量精力来提高他们的排名——因为只有在搜索结果中排名靠前的机会。
搜索引擎充分体现的马太效应:头部内容吸引大部分点击
有趣的是,与“马太效应”相对应的,还有一个很有影响的理论,叫做“长尾理论”。
长尾效应最早由《连线》杂志主编克里斯·安德森在 2004 年 10 月的一篇文章《长尾》中提出。长尾实际上是统计幂律和帕累托分布特征的扩展和通俗表达描述受欢迎和不受欢迎的项目的分布。克里斯·安德森通过观察数据发现,在互联网时代,由于网络技术可以让人们以较低的成本获得更多的信息和选择,很多网站中被“遗忘”的东西越来越多。不是最热门的事情又回到了聚光灯下。事实上,每个人的品味和喜好与主流人群并不完全相同,克里斯指出:我们发现的越多,就越意识到我们需要更多的选择。
推荐系统和长尾理论
一个实际的例子是亚马逊在线书店与传统大型书店的数据对比。市场上出版的图书数以百万计,但这些图书大部分无法在传统的大型书店出售(实体店空间有限),但可以放置在书店的显眼位置(如畅销书书架)因此,传统书店的经营模式多以畅销书为中心。然而,亚马逊等网络书店的发展,却为长尾书提供了无限广阔的空间。相比传统书店,用户浏览和购买这些长尾书要方便得多。因此,在互联网时代,小众图书销售量成千上万,哪怕一次只卖一本书。一个或两个,但因为这些书的种类比畅销书多得多,就像一条长尾巴,这些书的销量加起来甚至超过了那些畅销书。正如亚马逊的史蒂夫凯塞尔所说:“如果我有 100,000 本书并且一次只卖出一本,那么在 10 年内它们的销量就会超过最新的哈利波特书籍。“!”
作为一种新的经济模式,长尾理论已经成功地应用于网络经济领域。长尾资源的盘活和利用正是推荐系统擅长的,因为用户通常对长尾内容不熟悉,无法主动搜索。吸引用户注意力并发现他们的兴趣的唯一方法是通过推荐。,帮助用户做出最终选择。
对于企业来说,盘活长尾内容也很重要。打造内容丰富、百花齐放的生态,才能保证企业的健康生态。试想一下,如果一家公司仅仅依靠0.1%的“流行”产品或内容来吸引人气,那么随着时间的推移,这些热门产品将不再受欢迎,新的热门产品也不会及时填补。,那么公司的业绩难免会有很大的波动。
只依赖最热门内容的另一个不明显的危险是潜在用户的流失:因为只依赖热门内容才能吸引一批用户(简称A型用户),它也悄悄地排除了那些不感兴趣的用户。这些热门内容。用户(简称B型用户),根据长尾理论,B型用户的数量并不多,随着时间的推移,A型用户会逐渐变成B型用户(因为人喜新厌旧),所以依靠推荐系统才能充分满足用户个性化、差异化的需求,让长尾内容适时曝光,维护企业的健康生态,企业的运营能否更稳定,波动更小。
评价方法的异同
搜索引擎通常基于 Cranfield 评价体系,基于信息检索中常用的评价指标,如 nDCG(全称 normalized Discounted Cumulative Gain)、Precision-Recall(或其组合 F1)、 P@N 等方法)详情请参考之前在 InfoQ 上发表的文章《如何量化评估搜索引擎结果的质量陈韵文》。总体而言,评价的重点是尽可能将优质结果排在top搜索结果中,top 10 Bar结果(对应搜索结果第一页)几乎涵盖了搜索引擎评价的主要内容。让用户找到点击次数最少、速度最快的内容是评价的核心。
推荐系统的评价范围要广得多,推荐结果的数量往往要大得多,出现的位置和场景也很复杂。从量化的角度来看,应用于Top-N结果推荐时,MAP(Mean Average Precison)或CTR(Click Through Rate,常用于计算广告)是常用的衡量方法;当用于对预测问题进行评分时,RMSE(均方根误差)或 MAE(平均绝对误差)是常见的量化方法。
由于推荐系统更贴近实际业务,所以从业务角度来看也有很多侧评方法。根据不同的业务形态,有不同的方法,比如带来的增量点击、推荐成功的数量、交易转化的增加、用户停留时间延长等指标。
搜索和推荐的交集
搜索和推荐虽然有很多不同,但都是大数据技术的应用分支,有很多重叠之处。近年来,搜索引擎逐渐整合了推荐系统的结果,比如右侧的“相关推荐”、底部的“相关搜索词”等,都采用了推荐系统的产品思路和计算方式。推荐系统(下图中红圈区域)。
在其他基于平台的电商网站中,由于结果数量巨大,相关性差异不明显,搜索结果有一定的个性化排序空间。这里集成的个性化推荐技术也对促进交易很有帮助。
集成在搜索引擎中的推荐系统元素
推荐系统也使用了大量的搜索引擎技术。搜索引擎解决计算性能的一个重要数据结构是倒排索引技术(Inverted Index)。基于Recommendation),其中大量使用了倒排索引、查询、结果合并等方法。此外,点击反馈(Click Feedback)算法也被广泛用于两者来提高效果。