seo深度解析——全面挖掘搜索引擎优化的核心秘密(建立索引数据库的网页进行索引库中的全文搜索引擎(图))
优采云 发布时间: 2021-11-14 02:19seo深度解析——全面挖掘搜索引擎优化的核心秘密(建立索引数据库的网页进行索引库中的全文搜索引擎(图))
搜索引擎通常是指一种全文搜索引擎,它采集万维网上数千万到数十亿的网页,并将网页中的每个词(即关键词)编入索引,建立索引数据库。当用户搜索某个关键词时,页面内容中收录关键词的所有网页都会被搜索出来作为搜索结果。这些结果经过复杂的算法排序(或包括商业竞价排名、商业推广或广告)后,会根据与搜索关键词(或与相关性无关)的相关程度进行排序。
搜索引擎主动抓取网页,处理内容,索引的过程和机制一般如下:
1. 排除Spider,按照一定的策略将网页抓取回搜索引擎服务器;
2. 对检索到的网页进行链接提取和内容处理,去噪,提取页面主题文字内容等;
3. 对网页文字内容进行中文分词、去除停止顺序等;
4. 对网页内容进行切分后,判断页面内容是否与被索引的网页重复,将重复的页面剔除,将剩余的网页倒序索引,然后用户等待用于检索。
当用户进行查询时,搜索引擎工作的过程机制一般如下:
1.首先对用户查询的关键词进行分词处理,根据用户的地理位置和历史检索特征分析用户需求,以区域搜索结果和个性化搜索结果进行展示用户最需要什么内容;
2.查看缓存中是否有calc关键词的查询结果。如果是这样,为了尽快呈现查询结果,搜索引擎会根据当前用户的各种信息来判断真正的需求。结果经过微调或直接呈现给用户;
3. 如果用户查询的关键词在缓存中不存在,则检索索引库中的页面并进行排序,关键词和对应的搜索结果添加到缓存中
4. 网页排名是根据用户的搜索词和搜索需求,对索引库中网页的相关性、重要性(链接权重分析)和用户体验进行分析。用户在搜索结果中的点击和重复搜索行为也可以告诉搜索引擎,用户对搜索结果页面的体验。这个区域是最近作弊最多的部分,所以这部分会伴随着搜索引擎反作弊算法的介入,有时甚至会进行人工干预。
本内容来自SEO深度解析(全面探索搜索引擎优化的核心秘诀,第2版)