事实:陈小龙SEO:不会做伪原创的SEO不是好的SEO!
优采云 发布时间: 2022-11-19 17:26事实:陈小龙SEO:不会做伪原创的SEO不是好的SEO!
伪原创有什么好处吗?伪原创会被百度发现吗?在伪原创过程中,原创重要还是可读性重要?让我们聊天吧。
伪原创是SEO离不开的话题,但是网上关于伪原创的文章不是很全面,很不正常。我把这个知识点重新梳理一下。
假原创对排名的好处
搜索引擎的最终目标是向用户展示和提供有价值的内容。如果放弃优质内容,搜索引擎也会被用户淘汰,所以搜索引擎非常喜欢原创文章。
一个网站出现大量的原创内容,表明该网站的内容生产能力是足够的。搜索引擎自然会增加网站的抓取力,后续的相关收录和排名自然也会跟上。可以说搜索引擎非常喜欢原创内容。虽然原创性不是排名的绝对标准,但确实是一切的出发点。
在成为SEO高手的路上,必须要过伪原创的关卡。比如前文提到的钉钉使用的聚合策略,可以轻松帮助钉钉获得大量流量。
例如,很多灰帽SEO和黑帽SEO网站通常会使用伪原创工具,批量生成大量伪原创内容。在百度发现伪原创内容之前,他们通常可以在短时间内获得不错的排名。
也有一些网站通过比较复杂的采集和重组规则产生大量的新页面,也能做到词量大,排名稳定。如下图,我监控的一个教育行业网站,通过内容重组,创造了几十万条内容。排行榜涵盖了行业内大量的长尾词,取得了很好的效果。
伪原创适合什么类型的关键词?
对搜索引擎的内容有非常大的需求,但这种需求也是一个动态的过程。一些内容,无论是否原创,都需要新的内容;并且有些内容,即使是原创的,也会被非常严格的审查。,总是不包括在内,或者没有给出排名。
搜索引擎的最终目标是向用户展示和提供有价值的内容。如果放弃优质内容,搜索引擎也会被用户淘汰,所以搜索引擎非常喜欢原创文章。
也就是说,搜索引擎对待不同类型的 关键词 的程度是不同的。我们只想选择百度对伪原创容忍度高的关键词类型来操作。
让我们模拟一些场景:
一类关键词,比如“淘宝”、“微信”等,常年被大量用户搜索,网络上的相关内容非常充足。搜索引擎首先需要保证搜索首页推荐的内容是匹配的、专业的、能够满足用户需求的。对新内容更加谨慎,不会给新内容太多排名;
第一类关键词属于新用户需求,比如《信条》票房破2亿、《乘风破浪的姐姐总决赛》,相关搜索量明显增加,但内容不足。搜索引擎首先需要保证用户可以搜索。自然尽量收录相关的页面,并及时排名,避免用户搜索后找不到任何内容,影响用户体验。
(《淘宝》与《乘风破浪的姐姐总决赛》指示性变化)
个人总结,百度会放宽对内容少的关键词的监管,所以挖新词+找搜索量大但内容不多的词比较合适。如果你不会操作,我提供最简单有效的操作方式:只做长尾词伪原创内容。
伪原创成本低的优点
伪原创可以通过一定的规则对内容进行批量采集和重组,节目运营一天可以产出几万、几十万的内容,效率远高于专业的剪辑团队。即使不使用程序,也只能通过手动编辑来获得好的内容输出。
各类内容成本排序:
程序伪原创<人工伪原创<原创
无论采用哪种伪原创方式,单个内容的成本都远低于专业剪辑的成本。
优化效果好
伪原创内容在未被百度监控程序发现之前被列为原创内容,可以从百度原创内容算法中获得加分。内容中的关键词布局可以获得不错的排名。如果使用行业词库批量生产内容,排名效果会更好。
另外,原创内容占比大,对整个网站的排名也会有很大的好处。
伪原创的缺点
伪原创是搜索引擎必须绝对清理的东西,“假”字暴露了这类内容的下场。如果让我推荐用户信息,在其他因素相同的条件下,我宁愿推荐用户采集
的内容,也不愿推荐伪原创内容。因为伪原创内容可能存在的问题太多,比如可读性差、专业知识错误……这类问题一旦被用户发现不靠谱,用户对百度的信任度也会下降,从而伤害用户体验。
必须打击所有搜索引擎对伪原创的态度,并不断加强监控能力。做伪原创总是面临被K的威胁。
不能两者兼得,利弊需要SEOer权衡。
假冒原件被降级怎么办?
如果您发现您的伪原创内容被发现,您需要立即停止发布伪原创内容。尽快对之前发布的内容进行调整,增加每篇文章中原创内容的比例,提高可读性和内容相关性。等待百度重查。
另外,如果不希望虚假原创内容对网站造成严重影响,应尽量提高网站原创内容的比例,减少虚假原创内容的比例。这样即使对虚假原创内容进行处罚,也不会影响原创内容的排名。
" />
网站的关键关键词要放在优质的页面上,以免让关键关键词受到虚假原创的影响,保证网站的基本流量。
如何在不被检查的情况下制作假原件?
做一个伪原创就像做一个小偷。逃避百度调查就是在冒充自己。如何伪装成了主要话题。
一是保证不被百度发现,二是即使被百度发现,也不会被抹杀。要做到以上两点,需要制定多项伪原创策略,对内容进行充分调整,并根据百度算法不断调整内容生产策略。
搜索引擎是为了解决用户需求而设计的,所以我们要从搜索引擎的角度思考我们的伪原创内容如何解决用户需求,或者说假装能够解决用户需求。
搜索引擎需要为用户提供信息。如果信息不可读,反馈给百度的用户数据就会很差。即使百度的原创算法被忽悠了,也会在用户数据上掉下来。当然这个问题也可以通过快速排序的原理进行对冲来解决,这里就不展开了,以后有机会再写一篇文章介绍。
怎么知道伪造的原创内容有没有被百度监控到?
在采集阶段,可以观察伪原创内容和原创内容的采集速度和比例是否一致。
一般来说,要等到排名阶段才能判断是否被百度发现。一般2周左右给出排名。百度会对内容做出判断,给出新的排名。如果伪造的原创内容能够获得排名,则说明该内容通过了测试;排名持续2周。很多,说明该内容通过了百度的伪原创算法。
基于搜索引擎原理的伪原创算法监控*敏*感*词*↓
比如我之前的一个网站,通过内容重组,上传了上百条内容,关键词的排名迅速上升。2周后,排名开始下降。另一个网站也在2周左右的时间里出现了排名波动,但很快就稳定下来并开始好转,也算是安全通过了伪原创算法。
因此,如果伪原创内容排名靠前,且排名能持续2周以上,就说明通过了百度伪原创内容的监控。
-结尾-
伪原创的概念基本解释清楚了。如果你对伪原创内容感兴趣,你也想了解目前常见的伪原创攻略,学习当下可以排名的优质伪原创案例,寻找伪原创所需的数据采集源。独创性。
解决方案:安全攻城师系列文章[红日团队]-敏感信息收集
这次团队主要发布了一系列渗透测试基础知识,在此基础上文章会逐渐变难。本系列文章主要由安全研究员Orion为大家打造。后续视频也会慢慢录制,希望能给大家一个更好的学习场所。团队其他研究人员也在准备一系列关于powershell渗透的文章和视频,敬请期待。
安全攻城大师系列文章-敏感信息采集详解
安全攻城大师系列文章-信息采集工具使用说明
安全攻城大师系列文章-Web常见漏洞攻防
安全攻城大师系列文章-主机弱口令挖矿详解
安全攻城大师系列文章-主机漏洞挖掘详解
安全攻城大师系列文章-内网渗透详解
本系列文章和下系列文章的首选将在公众号上发布。如果你想看到最新的文章,请毫不犹豫地关注我们。
敏感信息采集
概念
信息采集
(Information Gathering),信息采集
是指通过各种手段获取所需的信息。信息采集
是信息利用的第一步,也是至关重要的一步。信息采集工作的好坏直接关系到整个信息管理工作的好坏。信息可以分为两类:原创
信息和加工信息。原创
信息是指在经济活动中直接产生或获取的数据、概念、知识、经验及其总结,是未经加工的信息。加工后的信息是对原创
信息进行加工、分析、改编和重组而形成的具有新形式和新内容的信息。
今天我们要介绍几种利用搜索引擎采集
信息的方法
没有一种方法是完美的,每种方法都有自己的优点,主动的方法,你可以获得更多的信息,但目标主机可能会记录你的操作记录。在被动方式下,你采集
到的信息会比较少,但你的行为不会被目标主机发现。一般来说,在一个渗透项目下,需要多次采集信息,同时采用不同的采集方式来保证信息采集的完整性。
说了这么多,我们来看看如何利用搜索引擎采集
有效信息
傻瓜式
搜索引擎使用
傻瓜联网设备搜索(简称:傻瓜)系统是湖南傻瓜科技*敏*感*词*开发的产品,用于在互联网上搜索联网设备。系统提供强大的搜索查询功能,支持多种设备搜索方式。主要包括:域名、IP地址、操作系统、数据库、Web容器、Web服务器语言、Web开发框架、Web应用框架、Web前端框架、特定设备、特殊页面内容等。
搜索引擎的地址是:
如何使用oshadan搜索引擎采集
有用的数据信息,简单看oshadan的功能
输入网站域名,可以看到网站的一些基本信息。
同时我们也可以使用ip进行搜索,可以看到返回的结果与域名查询结果是一样的。
如何使用高级搜索功能,我们需要创建一个有邮箱地址的用户,并登录进行搜索。登录后可以看到有高级搜索功能。
首先我们看一下设备搜索方法:
然后让我们使用搜索功能
我们可以看到有很多选项供我们选择
如果我们要查询Apache网站,而且是在中国,我们可以设置国家为“中国”,组件名称为“Apache”
如果我们要查找8080端口,美国网站,也可以在搜索框中输入“国家:美国端口:8080”。
上面我们看到搜索器功能还没有开发出来,那我们怎么搜索呢?
热键
" />
我们提供多个全站调用快捷键,让您随时升级到极客模式。
示例 1:
使用iis6.0搜索主机:app:”Microsoft-IIS”ver”6.0”,可以看到在0.2秒内搜索了大约8000个使用iis6.0的主机。
示例 2:
使用Apache2.2.16搜索主机:app:”apachehttpd” ver:”2.2.16”,可以看到在0.6秒内搜索了大约36万台使用Apache2.2.16的主机。
端口:开放端口。
搜索远程桌面连接:端口:3389
搜索 SSH:端口:22
示例 1:
查询主机开放3389端口:port:3389
同理查询22端口开放主机:port:22
操作系统:操作系统。示例:操作系统:linux
service:结果分析中的“服务名称”字段。
有关服务名称的完整列表,请参阅
公共网络摄像机:服务:“routersetup”
地点
country:国家或地区代码。
城市:城市名称。
有关完整的国家代码,请参阅:国家代码 - 维基百科
ip:搜索指定的IP地址
示例:搜索指定ip信息,ip:121.42.173.26
例1:IP的CIDR网段。网段:114.114.114.114/8
网络应用搜索
与host重复的语法规则这里不做说明,这里只说明web应用的查询方式
网站
示例:查询域名信息,站点:
" />
示例:搜索标题中收录
该字符的网站,标题:Nginx
关键词:
定义页面 关键词。示例:+ 关键字:Nginx
描述:
定义的页面描述。示例:desc:Nginx
文件类型:只返回使用指定文件类型创建的页面。
要查找以 PDF 格式创建的报告,请输入主题,然后输入文件类型:pdf
inanchor:、inbody:、intitle:这些关键字将返回在元数据中收录
指定搜索条件(如锚标记、正文或标题等)的网页。为每个搜索条件指定一个关键字,或根据需要使用任意多个关键字。要查找锚标记中收录
msn 且正文中收录
seo 和 sem 的页面,请键入
示例:inanchor:msn inbody:seo inbody:sem
site:返回属于指定站点的页面。要搜索两个或多个字段,请使用逻辑运算符 OR 对字段进行分组。
您可以使用 site: 搜索最多两级 Web 域、顶级域和目录。您还可以在网站上搜索收录
特定搜索词的页面。
url:检查列出的域或 URL 是否在 Bing 索引中。请输入网址:
谷歌搜索语法
intext:在网页的文本内容中搜索指定的字符
例如输入“intext:”一句话木马“”。这个语法类似于我们平时在某些网站上使用的“文章内容搜索”功能。
文件类型:搜索指定类型的文件。
例如,如果您输入“filetype:rar”,将返回所有以 rar 结尾的文件 URL。
站点:查找与指定网站关联的 URL。
例如,输入“站点:”。将显示与该站点关联的所有 URL。
Google 不区分大小写
Google 可以使用通配符:* 表示单词/短语
谷歌会智能地保留一些内容,比如一些过时的词,一些不适合展示的内容(比如非法信息)
最常用:“关键词”,双引号会强制谷歌搜索收录
关键词的内容
布尔运算符:AND(+) NOT(-) OR(|),现在不再需要AND,多个关键词+google会匹配
上面说了这么多,如何利用Google语法快速定位网站的有用信息,下面我们举个例子