搜索引擎优化(seo)的基本工作模块(搜索的普遍流程搜索,推荐,广告三兄弟,整体的技术栈 )

优采云 发布时间: 2022-03-03 06:18

  搜索引擎优化(seo)的基本工作模块(搜索的普遍流程搜索,推荐,广告三兄弟,整体的技术栈

)

  搜索的一般流程

  搜索、推荐、广告三兄弟,整体技术栈、流程框架比较相似。主要区别在于业务逻辑的细微差别,但可以肯定的是,搜索是三者中最重要的。

  搜索的整个过程也是召回和排序。但除此之外,看看一个成熟的搜索引擎,它远不止于此。总的来说,整个搜索可以看成以下几个阶段:

  数据预处理

  对于输入查询,第一步需要预处理成便于操作的形式,以便后续步骤能够有效进行。常见的操作有:

  经过预处理,可以得到一个比较规则的查询字段,然后逐步处理对应的查询。

  QU/查询理解

  QU部分的内容对于一个搜索引擎来说不是必须的,但是对于一个想要做好的搜索引擎来说却是必须的。整个QU部分的效果会对recall和sort两个阶段产生巨大的影响,后续的recall和sort都取决于这一步的结果。

  QU部分的技术栈基本都是nlp的一些常用操作。一般来说,它比nlp简单,因为目的很明确,用户的查询一定希望得到某种结果。主要内容如下:

  对于整个QU部分,它对下游工作起着至关重要的作用。这一步的效果很大程度上决定了下一步工作能做的上限。如果您处理查询并且它变得很差,那么后续的搜索步骤将无法获得良好的结果。

  召回模块

  这里实际上有三种主要类型的方法:

  分拣模块

  在一些项目中,排序会分为粗排序、细排序、重排等,但本质是一样的。有兴趣的去前面。

  其实这里的内容是大家经常看到的论文中最常见的部分。各种模型和结构,各种奇思妙想,基本都是以排序为主。

  排序的核心其实是三个方面,一是query的embedding,二是item的embedding,三是如何判断它们之间的相关性。大多数模型工作也关注这三点。

  但根据我的经验,在实际应用中,一个简单的 LR 模型可以解决 80% 到 90% 的问题。为了变得更好,那是您下一步需要模型的时候。

  其他内容

  在搜索的过程中,其他一些辅助功能也很重要。首先要做的是建议,它会提示并建议用户输入。这部分内容也可以结合纠错。

  还有一部分包括大数据分析。毕竟,搜索仍然是由不良案例驱动的。与推荐不同的是,用户的容忍度比较高,这对于不良案例的分析和解决也很重要。

  总结

  这个文章简单介绍了一个搜索引擎需要做的工作。可能不接触这方面的人认为搜索主要是在排序算法方向做研究。通过这篇文章文章可以帮助大家了解*敏*感*词*涉及的技术,想要尝试做一些搜索工作的朋友也可以加技能点以供参考。

  一般来说,搜索是一个需要算法和工程能力的领域。做算法或者开发者的朋友可以涉足这个领域,对人来说也是一个非常好的方向。

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线