搜索引擎禁止的方式优化网站(本发明专利技术涉及一种改进搜索引擎质量的方法,所述方法)
优采云 发布时间: 2022-01-11 10:15搜索引擎禁止的方式优化网站(本发明专利技术涉及一种改进搜索引擎质量的方法,所述方法)
本发明专利技术涉及一种提高搜索引擎质量的方法,该方法包括:(1)获取对应域名网站的注册信息;(2)@ >确定网站对应域名的信任度;(3)根据网站中描述的对应域名的信任度,执行以下步骤a), b) 或c): a) 计算网页的权威度PageRank;b) 修改锚文本传递到网站;或 c) 修改 网站 的网页相关性分数;本发明的专利技术提供了一种提高搜索引擎质量的方法,该方法可以对域名进行时间、年龄计算,
下载所有详细的技术数据
【技术实现步骤总结】
本专利技术涉及搜索引擎领域,具体涉及一种提高搜索引擎质量的方法。
技术介绍
在当今信息爆炸的大数据时代,搜索引擎已经成为人们获取信息不可或缺的手段。由于搜索引擎如此流行,并且受商业利益驱动,互联网上针对搜索引擎的欺骗网站越来越多。网页作弊主要包括:内容作弊,通常通过积累大量不相关的关键词来提高网页在搜索引擎中的排名;链接作弊,通过累积链接来增加这些网站页面的网页权限,PageRank和锚文本;搜索引擎爬虫作弊,网站是搜索引擎爬虫的网页和浏览器的另一个网页;还有购买过期域名的作弊行为,因为一些过期域名本身的PageRank排名很高,通过购买域名可以获得高价值的反向链接。现有的搜索引擎反作弊方法通常基于以下模型:对于已知的作弊方法,找到相应的作弊特征,然后使用有针对性的策略进行识别。例如,交换链接作弊可以通过站点之间的链接和相互链接的统计来判断。这种反作弊方法的缺点是延迟,即不能及时发现新的作弊方法。而且,作弊者在知道了搜索引擎的反作弊方法后,还可以升级作弊方法,绕过搜索引擎的反作弊机制。通过购买域名可以获得高价值的反向链接。现有的搜索引擎反作弊方法通常基于以下模型:对于已知的作弊方法,找到相应的作弊特征,然后使用有针对性的策略进行识别。例如,交换链接作弊可以通过站点之间的链接和相互链接的统计来判断。这种反作弊方法的缺点是延迟,即不能及时发现新的作弊方法。而且,作弊者在知道了搜索引擎的反作弊方法后,还可以升级作弊方法,绕过搜索引擎的反作弊机制。通过购买域名可以获得高价值的反向链接。现有的搜索引擎反作弊方法通常基于以下模型:对于已知的作弊方法,找到相应的作弊特征,然后使用有针对性的策略进行识别。例如,交换链接作弊可以通过站点之间的链接和相互链接的统计来判断。这种反作弊方法的缺点是延迟,即不能及时发现新的作弊方法。而且,作弊者在知道了搜索引擎的反作弊方法后,还可以升级作弊方法,绕过搜索引擎的反作弊机制。找到相应的作弊特征,然后使用有针对性的策略进行识别。例如,交换链接作弊可以通过站点之间的链接和相互链接的统计来判断。这种反作弊方法的缺点是延迟,即不能及时发现新的作弊方法。而且,作弊者在知道了搜索引擎的反作弊方法后,还可以升级作弊方法,绕过搜索引擎的反作弊机制。找到相应的作弊特征,然后使用有针对性的策略进行识别。例如,交换链接作弊可以通过站点之间的链接和相互链接的统计来判断。这种反作弊方法的缺点是延迟,即不能及时发现新的作弊方法。而且,作弊者在知道了搜索引擎的反作弊方法后,还可以升级作弊方法,绕过搜索引擎的反作弊机制。
技术实现思路
针对现有技术的不足,本专利技术提供了一种提高搜索引擎质量的方法,可以根据域名的注册时间计算域名的年龄,根据不同的信任度给予不同程度的信任。年龄,然后确定<网站质量修复,以提高搜索引擎质量,避免网站作弊。本专利技术的目的是通过以下技术方案实现的:一种提高搜索引擎质量的方法,改进之处在于该方法包括:(1)获得对应域名的注册< @网站信息;(2)@>判断网站对应域名的信任度trust;(3) 根据网站对应域名的信任度trust,执行以下步骤a)、b)或c): a)修正网页的权威PageRank计算;b) 更正向 网站 传递的锚文本;或 c) 校正 网站 的相关性分数。优选地,所述注册信息包括:域名注册时间、域名续费时间、域名到期时间和域名注册人。优选地,步骤(2)@>包括: (2-1)处理器计算域名年龄a,公式为:域名年龄a=当前时间-域名注册时间(1)@ > 公式(1)中,域名年龄a为实数,单位为年;若域名变更域名注册人,域名注册时间为域名变更域名注册人的时间;(2-2)@>根据域名年龄a计算域名的信任度trust。进一步地,步骤(2-2)@>包括:根据下式计算域名的信任度trust域名年龄a,公式为: 式中(2)@>,r为域名租用期等于域名到期时间与域名注册时间之差,λ为阈值,λ是大于或等于 3 的正整数。
优选地,步骤a)包括:如果网站对应域名的过期时间小于当前时间,则网站的网页不向外传输权限度PagePank。 ; 如果网站 网站对应域名的过期时间大于当前时间,则网站下发的网页的权威度PagePank乘以信任度trust域名;如果网站对应的域名在续费时间点更改域名注册人,续费时间点之前的入链不会将权限PagePank传给对应的网站域名,和域名对应的出链网站 更新时间点之前权威的PagePank没有传出去。优选地,步骤b)包括:如果网站对应的域名的到期时间小于当前时间,则网站的网页不向外发送锚文本。@>对应域名的过期时间大于当前时间,则网站网页向外界传输的锚文本乘以该域名的信任度;如果网站对应的域名在续费时间点击更改域名注册人,则不会传输续费时间点之前的锚文本。优选地,步骤c)包括:如果网站对应的域名的过期时间小于当前时间,将网站的网页的相关性得分乘以惩罚系数β,0<β<0.1;如果网站对应域名的过期时间大于当前时间,则将网站网页的相关度得分乘以该域名的信任度信任度。与最接近的现有技术相比,本专利技术的有益效果是:本专利技术提供了一种提高搜索引擎质量的方法,可以根据域名的注册时间计算出域名的年龄,并给出不同的价值观根据年龄。信任度,然后根据域名的信任度修改网站的质量;具有很强的通用性和可靠性,不管作弊者如何改变作弊方式,只要作弊者使用更新的域名作弊。作品,同时作弊者无法控制自己网站
附图说明图。附图说明图1为本发明专利技术提供的一种提高搜索引擎质量的方法流程图。具体实施方式下面结合附图对本专利技术的具体实施方式作进一步详细说明。为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整的描述。 . 以上所述的实施例是本专利技术的一部分实施例,而不是全部的实施例。基于该专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。网站骗子在短时间内购买域名。如果作弊被搜索引擎发现并压制,他们将放弃这些域名,并购买另一套新域名继续作弊。另一方面,一个好的网站通常会精心管理多年,一次购买一个长域名。从这个意义上说,较新的域更容易作弊,而寿命较长的域通常是正常的网站。因此,利用网站的域名注册信息来提升搜索引擎的质量,可以作为传统反作弊手段的良好补充;该专利技术提供了一种提高搜索引擎质量的方法,主要是利用网站域名注册信息来提高搜索质量,注册信息包括:域名注册时间、域名续费时间、域名到期时间和域名域名注册人等。这些信息可以从域名注册商处获得。根据这些域名注册信息,计算出域名的信任度,可以将信任度应用到搜索引擎的各个环节,如图1所示,包括以下步骤:(1)获取网站对应域名的注册信息;(2)@>判断对应域名网站的信任度trust;(3) 根据网站对应域名的信任度trust,执行以下步骤a)、b)或c): a)修正网页的权威PageRank计算;b) 更正向 网站 传递的锚文本;或 c) 校正 网站 的相关性分数。
PageRank计算、锚文本统计和相关性分数计算,为了提高搜索引擎的质量,PageRank是指一个网页的权威性,每个网页的PageRank由链接网页的PageRank决定,其value 与链接网页的数量和链接网页的 PageRank 成正比。PageRank 是一个搜索引擎。因此,网站作弊者构建了大量的网络链接结构来提高他们网页的PageRank,其值与链接网页的数量和链接网页的PageRank成正比。PageRank 是一个搜索引擎。因此,网站作弊者构建了大量的网络链接结构来提高他们网页的PageRank,其值与链接网页的数量和链接网页的PageRank成正比。PageRank 是一个搜索引擎。因此,网站作弊者构建了大量的网络链接结构来提高他们网页的PageRank,
【技术保护点】
一种提高搜索引擎质量的方法,其特征在于,该方法包括:(1)获取对应域名网站的注册信息;(2)@>确定对应域名网站(3)根据网站对应域名的信任度信任,进行如下步骤a)、b)或c): a)计算权限修改后网页的PageRank度;b ) 将锚文本传递到 网站;或 c) 修复 网站 的页面相关性分数。
【技术特点总结】
1.一种提高搜索引擎质量的方法,其特征在于,该方法包括:(1)获取对应域名的注册信息网站;(2)@>确定网站对应域名的信任度信任;(3)根据上述网站对应域名的信任度,执行以下步骤a)、b)或 c): a) 更正网页度 PageRank 计算的权限;b) 更正向 网站 传递的锚文本;或 c) 修正 网站 的网页相关性分数。2.根据权利要求1所述的方法,其特征在于,所述注册信息包括:域名注册时间、域名续费时间、域名到期时间、域名注册人。
【专利技术性质】
技术研发人员:吴伟林、许焕清、郭永富、陈培、
申请人(专利权)持有人:,
类型:发明
国家、省、市:北京;11
下载所有详细的技术数据 我是该专利的所有者