文章采集调用(一个企业网站被百度降权了怎么办?(图))

优采云 发布时间: 2022-04-12 06:32

  文章采集调用(一个企业网站被百度降权了怎么办?(图))

  去年年底,一位客户要求我帮助创建一家公司网站。考虑到 网站 将来会推广搜索引擎,网站 在 SEO 中必须是搜索引擎友好的。最后我选择了DeDecms,它可以在URL、PageTitle、TextBlock、LinkBlock、Auto Sitemap、Related Article中做早期的SEO布局。所以在栏目规划、版面设计、模板制作阶段,我将各种SEO元素充分融入到整个制作阶段,希望网站上线后,能够快速积累搜索排名权重。尤其是在模板代码编写方面,可以有效控制链接输出和导入,尽可能提高内部链接的相关性和关键词的匹配位置,去除无用的网页噪音信息,

  果然,网站正式发布后,网站收录的占比迅速达到70%,大部分产品终端页面为收录,部分信息页面为收录 ,更重要的是:行业关键词排名和产品关键词排名进步很快;整个网站在SEO运营中呈现良性发展态势。客户端开始接管网站并正常更新站点内容,按照设定的时间表,一切应该都进行得很顺利。

  不过最近网站SEO的表现开始下滑,网页数量收录首当其冲。百度统计后台显示的页面索引与搜索框中site命令返回的结果数量有显着差异。site 命令显示 Only 2 pages are 收录,都是首页,首页有 www 和没有 www 的两个版本。另外,信息正常更新后,百度索引很快,短时间内可以通过site命令返回结果,但过了一会儿发现收录无效。基于以上情况,我认为网站已经被百度降级了。

  为了找到问题所在,我研究了各种因素,发现:

  (1)除了正常更新网站的内容外,企业端也在积极运营外链,建外链是好事,但是用错了方式参与资源站的链轮;

  (2)网上有相同模板、相同内容、不同品牌的仿站,而百度上的仿站收录也只有首页,“惊人的相似” ”给客户网站。

  1、关于链轮问题,幸好我及时发现并制止了这种行为。由于参与sprocket的产品页面只有几个,时间不长,应该不会有这么大的影响,更何况自己的资源站。.

  2、关于重复站点,非常少见。大多数人会自觉地在网站内​​容或组织形式上形成差异;而如果客户网站有这样的SEO症状,恐怕关键就在于仿网站,当我看到仿网站的时候,我完全无语了。除了公司的品牌名称不同,网站我都太了解了;本来想吐槽的,但回头看,现在网络不流行了。是不是到处都有抄袭的趋势?或许习惯了就好,但我不能忍受的是模板100%模仿,数据完整采集没事,拜托,你敢不敢放是99 % 相同的网站作为一个整体发布?你TMD搞SEO,不知道类似网站!你的TMD模仿站也可以模仿我过去写的自动更新的网站地图文件sitemap.php!做SEO伤不起啊。

  吐槽回吐槽,问题还是要解决,采用了几个方法:

  1、调整模板数据调用规则和新内容块布局

  新的内容块会使页面主题关键词更加分散,并调整数据调用规则,使仿站点的数据与自己页面的数据不同,减少复制网站的负面影响@>搜索引擎优化问题。

  2、想办法阻止内容采集

  DeDecms本身就有防止采集混淆字符串的功能,但是这种防止采集的方法对SEO来说是非常不利的。您不希望搜索蜘蛛看到网页中有许多隐藏的隐藏对象。文字,而这些文字会影响蜘蛛对信息块主题的判断,影响关键词的排名。事实上,DeDecms并没有根本的办法来阻止采集,而且是一尺高。高一章,只要通过页面发布你的信息,总能找到采集的方法;我根据网上搜集的资料采用了两种方法,只能放最基本的采集。>:

  (1)方法一:复制网页正文内容时自动添加版权信息

  JavaScript 代码

  将上面的代码放在文章页面模板中文本末尾之后。这个方法我测试过,只对IE浏览器有效,对火狐、傲游、谷歌浏览器无效。

  (2)方法二:使页面代码唯一

  一般别人采集时,要获取内容的起始码和结束码,而且必须是唯一的,所以填写的起始码多为:

  . 这样,我们在这个类后面加上文章的ID值,改成这个

  ,其中{dede:field.id/}获取dedecms中当前文章的ID值,那么每个生成的文章的ID值都不一样,这里的起始代码为也不同,所以其他人将无法采集,并且您一次只能选择一件。

  当我们制作模板时,在body标签附近

  变成

  ,注意空格+{dede:field.id/},所以div的class没有变,但是

  ,此代码在每个文章的内容页面中是唯一的,或者在html标签中插入id={dede:field.id/},例如:

  并且,这里的{dede:field.id/}是在dedecms中获取当前文章的ID值,这样别人就无法采集了,只有一个可以一次采集。当然,其他人可以使用过滤规则来移除,但是如果我在所有类中插入文档ID,或者插入id=文档ID。然后他只能采集整个页面,然后过滤,使得采集更加复杂。

  缺点:如果{dede:field.id/}插入的不够多,其他人可以用过滤规则过滤掉。但是对于一些站群采集软件来说,这个招数就足以阻止他们采集了!

  3、升级DeDecms到最新版本

  DeDecms老版本有漏洞,很容易被黑,要么嵌入各种广告代码,要么无缘无故添加太多隐藏链接,所以一定要升级到最新版本。

  上一篇:织梦cms:错误的解决方法:check Snooping out of bounds

  下一步:设置dedecms标签[field:global.autoindex/]的初始值

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线