seo优化搜索引擎工作原理(蜘蛛(搜索引擎的网站采集系统简称蜘蛛)的工作原理)
优采云 发布时间: 2021-12-28 21:18seo优化搜索引擎工作原理(蜘蛛(搜索引擎的网站采集系统简称蜘蛛)的工作原理)
搜索引擎的工作原理
第一步,爬取和爬取:搜索引擎沿着网站的链接爬行,抓取链接对应的页面。
蜘蛛(简称搜索引擎的网站采集系统)专注于抓取网页的文本内容。所以seo优化的重点是更新更多的内容,注意不要放太多的“蜘蛛陷阱”比如:很多图片,很多flash,很多js代码,视频文件等等,这些东西蜘蛛是抓不住的 如果你拿了,就说明你网站的“蜘蛛陷阱”部分什么都没写,蜘蛛会认为你的网站性价比高,是垃圾网站!
还需要注意蜘蛛沿着链接爬取网页,所以网站内应该没有死链接(无效链接),网站的链接层次不要太深。最好有一个树状的扁平层次结构,即主域名。后面的层次不要太多,每个斜杠代表一个层次(意思和文件路径一样),尽量优化到最少!
第二步,将抓取到的内容存储在搜索引擎的原创
数据库中。
第三步,预处理
处理和组织原创
数据库中捕获的内容
1、 去重处理:就是丢弃网站上与原创
数据相似的内容,抄袭的内容肯定会被丢弃。
2、 停止词处理:停止词是指,oh,和ground等模态粒子吗,所以如果你加了模态粒子假装是原创的,你会被发现,也被淘汰为相似之处。
3、中文分词(分词)处理:搜索引擎会根据自己的字典对词进行分词,将标题和内容分割成很多关键词,所以在标题和内容关键词 分布。
<p>4、查看页面关键词密度:提取网站的关键词并比较你的页面内容,计算页面的关键词密度是否合理,如果密度过低,意味着你的