文章采集调用(一个企业网站被百度降权了怎么办？(图))

优采云发布时间: 2022-04-12 06:32

　　去年年底，一位客户要求我帮助创建一家公司网站。考虑到网站将来会推广搜索引擎，网站在 SEO 中必须是搜索引擎友好的。最后我选择了DeDecms，它可以在URL、PageTitle、TextBlock、LinkBlock、Auto Sitemap、Related Article中做早期的SEO布局。所以在栏目规划、版面设计、模板制作阶段，我将各种SEO元素充分融入到整个制作阶段，希望网站上线后，能够快速积累搜索排名权重。尤其是在模板代码编写方面，可以有效控制链接输出和导入，尽可能提高内部链接的相关性和关键词的匹配位置，去除无用的网页噪音信息，

　　果然，网站正式发布后，网站收录的占比迅速达到70%，大部分产品终端页面为收录，部分信息页面为收录，更重要的是：行业关键词排名和产品关键词排名进步很快；整个网站在SEO运营中呈现良性发展态势。客户端开始接管网站并正常更新站点内容，按照设定的时间表，一切应该都进行得很顺利。

　　不过最近网站SEO的表现开始下滑，网页数量收录首当其冲。百度统计后台显示的页面索引与搜索框中site命令返回的结果数量有显着差异。site 命令显示 Only 2 pages are 收录，都是首页，首页有 www 和没有 www 的两个版本。另外，信息正常更新后，百度索引很快，短时间内可以通过site命令返回结果，但过了一会儿发现收录无效。基于以上情况，我认为网站已经被百度降级了。

　　为了找到问题所在，我研究了各种因素，发现：

　　（1）除了正常更新网站的内容外，企业端也在积极运营外链，建外链是好事，但是用错了方式参与资源站的链轮；

　　（2）网上有相同模板、相同内容、不同品牌的仿站，而百度上的仿站收录也只有首页，“惊人的相似” ”给客户网站。

　　1、关于链轮问题，幸好我及时发现并制止了这种行为。由于参与sprocket的产品页面只有几个，时间不长，应该不会有这么大的影响，更何况自己的资源站。.

　　2、关于重复站点，非常少见。大多数人会自觉地在网站内容或组织形式上形成差异；而如果客户网站有这样的SEO症状，恐怕关键就在于仿网站，当我看到仿网站的时候，我完全无语了。除了公司的品牌名称不同，网站我都太了解了；本来想吐槽的，但回头看，现在网络不流行了。是不是到处都有抄袭的趋势？或许习惯了就好，但我不能忍受的是模板100%模仿，数据完整采集没事，拜托，你敢不敢放是99 % 相同的网站作为一个整体发布？你TMD搞SEO，不知道类似网站！你的TMD模仿站也可以模仿我过去写的自动更新的网站地图文件sitemap.php！做SEO伤不起啊。

　　吐槽回吐槽，问题还是要解决，采用了几个方法：

　　1、调整模板数据调用规则和新内容块布局

　　新的内容块会使页面主题关键词更加分散，并调整数据调用规则，使仿站点的数据与自己页面的数据不同，减少复制网站的负面影响@>搜索引擎优化问题。

　　2、想办法阻止内容采集

　　DeDecms本身就有防止采集混淆字符串的功能，但是这种防止采集的方法对SEO来说是非常不利的。您不希望搜索蜘蛛看到网页中有许多隐藏的隐藏对象。文字，而这些文字会影响蜘蛛对信息块主题的判断，影响关键词的排名。事实上，DeDecms并没有根本的办法来阻止采集，而且是一尺高。高一章，只要通过页面发布你的信息，总能找到采集的方法；我根据网上搜集的资料采用了两种方法，只能放最基本的采集。>:

　　(1）方法一：复制网页正文内容时自动添加版权信息

　　JavaScript 代码

　　将上面的代码放在文章页面模板中文本末尾之后。这个方法我测试过，只对IE浏览器有效，对火狐、傲游、谷歌浏览器无效。

　　(2）方法二：使页面代码唯一

　　一般别人采集时，要获取内容的起始码和结束码，而且必须是唯一的，所以填写的起始码多为：

　　. 这样，我们在这个类后面加上文章的ID值，改成这个

　　，其中{dede:field.id/}获取dedecms中当前文章的ID值，那么每个生成的文章的ID值都不一样，这里的起始代码为也不同，所以其他人将无法采集，并且您一次只能选择一件。

　　当我们制作模板时，在body标签附近

　　变成

　　，注意空格+{dede:field.id/}，所以div的class没有变，但是

　　，此代码在每个文章的内容页面中是唯一的，或者在html标签中插入id={dede:field.id/}，例如：

　　并且，这里的{dede:field.id/}是在dedecms中获取当前文章的ID值，这样别人就无法采集了，只有一个可以一次采集。当然，其他人可以使用过滤规则来移除，但是如果我在所有类中插入文档ID，或者插入id=文档ID。然后他只能采集整个页面，然后过滤，使得采集更加复杂。

　　缺点：如果{dede:field.id/}插入的不够多，其他人可以用过滤规则过滤掉。但是对于一些站群采集软件来说，这个招数就足以阻止他们采集了！

　　3、升级DeDecms到最新版本

　　DeDecms老版本有漏洞，很容易被黑，要么嵌入各种广告代码，要么无缘无故添加太多隐藏链接，所以一定要升级到最新版本。

　　上一篇：织梦cms：错误的解决方法：check Snooping out of bounds

　　下一步：设置dedecms标签[field:global.autoindex/]的初始值

0

2022-04-12

文章采集调用

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

文章采集调用(一个企业网站被百度降权了怎么办？(图))

0 个评论

发起人

AI时代内容工厂

文章采集调用(一个企业网站被百度降权了怎么办？(图))

0 个评论

发起人

相关问题