输入关键字 抓取所有网页(2个月前Gseeker的帖子:它将会革掉Google的命?)
优采云 发布时间: 2022-02-09 05:10输入关键字 抓取所有网页(2个月前Gseeker的帖子:它将会革掉Google的命?)
转发 Gseeker 2 个月前的帖子
MyLiveSearch:它会杀死谷歌吗?
2007 年 5 月 29 日
<p>我们现在使用的大部分搜索引擎的工作原理都是类似的,就是搜索引擎发出爬虫,不断地跟踪互联网上的链接网站,并分析它们所经过的网页内容,然后把它们网站@收录进入搜索引擎的索引库;当用户输入关键词进行搜索时,搜索引擎会从已有的索引库中返回相关结果。全球四大搜索引擎Google、Yahoo!、Microsoft Live Search 和ASK 均采用此模式。谷歌更好,因为它的算法返回更相关和更准确的搜索结果。但可以想象,这种模式的缺点也很明显,即它提供的搜索结果不是实时的,而是基于索引数据库的。进一步来说,只有爬虫爬取的网页内容才会出现在索引库中,然后才能被用户搜索。也就是在这种模式下,用户得到的搜索结果不是最新的,因为网站新的内容要等待爬虫抓取,分析和