站内搜索与互联网通用搜索引擎在概念上的应用
优采云 发布时间: 2021-06-15 19:14站内搜索与互联网通用搜索引擎在概念上的应用
垂直搜索和站点搜索
与互联网上的一般搜索引擎相比,所谓的垂直搜索引擎和站内搜索引擎在概念上更简单。它们可以看作是对现有通用搜索引擎的概念进行裁剪后形成的产品。垂直搜索是针对特定行业领域的搜索服务。例如提供BT资源搜索的搜索引擎。一般这类搜索引擎会简化采集的数据,只搜索网站指定的网页资源。在数据处理方面,以BT资源搜索引擎为例,该引擎仅从网页信息中提取资源名称关键词和BT*敏*感*词*链接地址,忽略其他信息。在数据索引模块中,引擎只做简单的关键字索引,没有处理语义。网站上的搜索引擎更简单。引擎只需要被动等待数据采集模块中的信息输入。这是因为网站的设计是可控的。当站点记录任何信息并将副本发送到搜索引擎时,搜索引擎可以执行其后续逻辑流程。搜索论坛帖子是一个典型案例。当用户提交帖子时,站点会将提交的内容转发到站点搜索引擎。搜索引擎收到帖子文本后,开始数据处理并索引到数据库中。这一切都不需要对网页文件进行处理,避免了大量的网页标签过滤工作。
随着越来越多的 Web 应用程序使用 JavaScript 来动态生成用户内容,传统的互联网搜索引擎正在失去其传统优势。在移动优先的设计理念下,传统通用搜索引擎采集的静态网页的有效内容可能只有一行关键词代码,但网页可以在用户端展示丰富多彩的内容。因此,在不久的将来,站点搜索将扮演越来越重要的角色。或许每个公共站点都会有自己的个性化搜索引擎,原本由通用搜索引擎提供的站点搜索将逐渐消失。