seo教程 搜索引擎优化入门与进阶第三版扫描版(捕获web页面称为索引规则发生了哪些变化?(图))
优采云 发布时间: 2021-11-29 03:15seo教程 搜索引擎优化入门与进阶第三版扫描版(捕获web页面称为索引规则发生了哪些变化?(图))
获取网页。每个独立的搜索引擎都有自己的网络爬虫程序(Spider)。爬虫沿着网页中的超链接从这个网站爬到另一个网站,通过超链接分析来分析更多网页的连续访问。捕获的网页称为网页快照。因为超链接在互联网上的应用非常普遍,理论上我们可以从一定范围的网页开始采集大部分网页。
处理网页。抓取网页后,搜索引擎还需要做大量的预处理工作才能提供检索服务。最重要的是提取关键词,建立索引库和索引。其他包括删除重复网页、分词(中文)、确定网页类型、分析超链接、计算网页的重要性和丰富度等。
提供检索服务。用户输入搜索关键字,搜索引擎在索引数据库中找到与该关键字匹配的网页。为方便用户判断,除提供页面标题和网址外,还会提供网页摘要等信息。
搜索引擎自动信息采集功能提交网站搜索。站长主动向搜索引擎提交网站。它将在固定时间内将爬虫发送到您的网站,扫描您的网站并将信息存储在数据库中供用户使用。因为搜索引擎的索引规则已经发生了很大的变化。与以往相比,主动提交网站并不能保证你的网站可以进入搜索引擎数据库,所以站长应该增加网站内容的数量,让搜索引擎有更多有机会找到您并自动采集您的 网站。
当用户使用关键词搜索信息时,搜索引擎会在数据库中进行搜索。如果你发现一个网站,满足用户要求的内容,一个特殊的算法——通常是根据页面中关键词的匹配程度、位置、频率、链接质量等——计算页面性别与排名的相关性。然后,根据关联程度,将这些链接依次返回给用户。