网站内容抓取(符合搜索习惯的网站建设有哪些需要注意的因素?)
优采云 发布时间: 2021-10-05 01:24网站内容抓取(符合搜索习惯的网站建设有哪些需要注意的因素?)
说到SEO优化,首先要解决网站的收录问题。聪明的女人做饭没有米饭难,SEO效果没有收录也难谈。
思维分析
————
对于网站有一定权重,或者网站优化了一段时间,早上完全可以接收,但是对于新站,我要收录 网站首页不难,但是为了每天更新的网站更好的收录内容需要一定的努力。
无论是新站内容更新还是加权网站内容更新,一般我们会在网站内容更新后第一时间通过搜索引擎站长平台提交新的输出网址,或者离开通过第三方网站(网站经常被搜索引擎蜘蛛抓取)的新网址链接,从而达到尽快被搜索引擎抓取和收录的目的。
当然,通过站长平台提交或发布外链是吸引蜘蛛爬行的一种方式,而符合搜索引擎爬行习惯的网站的构建更容易受到蜘蛛的青睐,从而大大提高提高网站内容收录速度。那么构建符合搜索和爬取习惯的网站需要注意哪些因素呢?
01
—
简单明了的网站结构
搜索引擎蜘蛛程序(Spider)的爬取相当于遍历了整个网站,那么简洁明了、结构化的网站绝对是Spider喜欢的,并且尽可能的改进。网站蜘蛛的可读性。
(1)最佳树状结构是“首页”栏目频道“文章(内容)详情页”
(2)Flatness是指首页和详情页之间的结构层级尽量小,降低网站的内容层级的深度,既满足了蜘蛛爬行的友好性,但也可以很好地控制。重量转移
(3)网状内容结构要求每个页面至少有一个文本链接指向它,这样可以让网站更深的页面更容易被抓取收录,好的内链优化可以有同时对长尾关键词来说,内部链构建是其最大的链接资源。
(4)导航一般收录在整个网站的每个页面中,方便用户直观了解整个网站的内容结构,同时时间,搜索引擎爬取不同内容列的分层页面
(5)另外,在子域(二级域)和子目录(二级目录)的选择上,一般建议网站@的内容优先选择子目录> 可以投入的资源是少还是少,有利于权重的继承和传递。(这个问题这里就不赘述了,有兴趣的朋友可以移步《如何选择二级域名》名和一个优秀的SEOer在二级目录”了解二级域名和二级目录在SEO和选择技巧中的优缺点)
02
—
简单漂亮的URL规则
(1)URL的唯一性是指网站中同一内容页只对应一个url,指向同一个内容页但不同形式的url存在过滤风险,从而影响内容页收录的
(2) 一般来说,静态网址更受搜索引擎欢迎,但非静态网址和无网址伪静态网站,尽量保证动态网址的简单性,即参数少尽可能在动态 URL 中。使 url 的总长度尽可能短
(3)的审美一方面让网站的URL结构一致,也能让用户和机器通过URL来判断页面的大致内容,比如可以直观的看到该页面1.html 是关于 SEO 内容的
提示:URL 应尽可能短且易于阅读。如果栏目没有对应的英文或缩写,可以使用拼音作为目录名;在保证网址和网页内容唯一性的情况下,长动态网址应该去掉无意义的参数;如果无法保证url的唯一性,需要通过301将不同形式的URL重定向到目标URL
03
—
其他 SEO 考虑因素
(1)不要忽略倒霉的robots文件,某些情况下系统robots是禁止被搜索引擎抓取的,所以当网站即将上线时,注意检查机器人文件,网站 日常 维护时也要注意定期检查
用户代理: *
不允许: /
禁止所有搜索引擎抓取网站
用户代理:百度蜘蛛
允许: /
只允许百度爬取网站
User-agent表示以下规则是针对哪个搜索引擎的,*代表所有搜索引擎;Disallow 和 Allow 分别代表禁止和允许
(2)创建网站站点地图文件和死链文件,及时通过百度站长平台提交
指定站点地图文件在机器人文件中的位置
(3)合理使用站长平台提供的robots、站点地图、索引量、抓取频率、死链提交、网站改版等工具。
写在最后
————
收录是网站进行SEO操作的基础。通过搜索引擎站长平台的提交工具和站点地图提交网址链接,有助于网站新内容快速搜索Grab。网站,符合搜索引擎的抓取习惯,从根本上增加了搜索引擎的偏好度,从而帮助网站实现快速收录。两者的区别就像,前者是你给搜索引擎发糖,后者是让搜索引擎习惯性地向你索要糖。
做SEO也是一样。对于SEO的思考和实践,不同的SEOer有自己的看法和经验!