搜索引擎优化入门与进阶(SEO优化:了解百度和谷歌搜索引擎实际分解索引的过程)
优采云 发布时间: 2021-12-29 07:00搜索引擎优化入门与进阶(SEO优化:了解百度和谷歌搜索引擎实际分解索引的过程)
专注于SEO优化,了解百度和谷歌搜索引擎索引的实际过程。索引是搜索引擎的重要组成部分。渴望粉丝关注我更新的文章,因为我一步步的了解SEO优化。如果不直接关注这部分,可能会有点难以理解。但是我相信你可以很好地理解这部分。理解因人而异。希望大家了解SEO优化的所有内容部门。重复一遍,搜索引擎有四个部分:1. 爬取、2. 过滤、3. 索引和4. 查询。今天来解释一下index部分收录
了多少个点:注:Index(重要的是“相关性”的概念,也就是所谓的“预处理”)
1、 文本内容提取:搜索引擎的文本处理能力相对较强,其次是图片、视频等处理能力相对较弱。理解:当我们更新传入和传出的文章时,我们必须专注于文本,没有办法发送其余的内容
2、 停用词:什么是停用词?我们可以将其理解为语音停顿所呈现的词,称为结束词。比如你在哪里,你在做什么,我的SEO等等,“啊”,“啊”,“德”,“等等”大部分时间不会被索引网页和互联网网页
3、 小碧:我们在现实生活中首先可以理解这两个词,小碧:消失、消除、躁狂:烦躁是由于浮躁、出汗、烦躁,导致出汗、躁狂、烦躁。愤怒和冲动。我们知道,搜索引擎在提取您的网页时会先提取标题,提取文章内容时会给出较高的分数,提取文章以外的内容时会给出较低的分数。如果你想关键词 排名好,得分高,尽量出现在文章页面。
4、 中文分词:分词,正向匹配,反向匹配,双向匹配,词库:分词就是在词之间读取,因为搜索引擎只读取一个词,当分词分离时,搜索引擎还有其他方法,就是通过正向匹配、在用反向匹配和双向匹配来获取你文章内容的相关性和可读性。词库:百度和谷歌都有自己的词典来分析你网站文章的相关性(网站内外文章的相关性)
5、提取关键词信息: 理解:搜索引擎提取互联网上所有与web关键词相关的文章进行比较。例如,该网站信任度高、评分高、投票人数多。关键词的公平排名也很相关,会让你的页面排名很高。
6、 重复数据删除:理解:当一个网页重复出现时,搜索引擎会检测到你的网页文章太不自然关键词
7、 倒排索引(正向和反向介绍):正向(主要是网页文档,关键词是聚合永久存储的数据库),反向(主要是关键词,网页文档是聚合)数据库为准
8、 链接计算(得分和相关性) 外链/内链:网站的网页和文章的内容尽可能相关。搜索引擎计算出链接的文章连续性强,得分较高。
9、 页面过滤:换句话说,搜索引擎比较互联网上所有网页的内容。您网站的内容被抄袭,可能会被过滤掉而不是被编译到数据库中,但是那些高度信任的
10、 页面指纹(空间相量概念) 搜索引擎提取网页文章进行MD5加密处理,比较判断文章的原创性(信任度高的网站会认为你很原创)。百度和谷歌通过分析方向词的方向相量和功率来判断文章的原创性不是原创。差异性和相关性越大,文章的原创性就越强。