搜索引擎优化 关键词( 基于约束条件的聚类算法实现搜索引擎关键词关键词优化(图))

优采云 发布时间: 2021-10-13 08:41

  搜索引擎优化 关键词(

基于约束条件的聚类算法实现搜索引擎关键词关键词优化(图))

  

  本发明涉及语义网络技术领域,具体涉及基于约束条件的聚类算法实现搜索引擎关键词优化。

  背景技术:

  搜索引擎已经成为网民获取信息的重要工具。搜索引擎优化(Search Engine Optimization,简称SEO)是指利用相关技术对一系列网站进行优化,从而提高相应关键词在搜索引擎上的排名,并最终达到网站营销的目的。实际上,搜索引擎优化是一种网络营销形式,它允许企业利用主要的搜索引擎优化策略,对网页中的关键词、内容、链接等各种因素进行优化,使应用程序经过策略,企业网站可被各大主流搜索引擎和收录抢先抓取,在索引目标页面排名靠前,吸引点击率,从而提升企业形象,宣传网站的目的。在目前所有的网络营销形式中,搜索引擎优化无疑是在短时间内扩大影响力、提升企业形象的最佳方式。SEO归根结底是对关键词的优化。关键词是用户搜索相关页面时使用的词或词组,也是搜索引擎用来建立索引表的词。使用 关键词 有助于获得更高的搜索引擎查询排名。需要指出的是,关键词 的研究旨在寻找最有价值的关键词。目前,*敏*感*词*对关键词优化的理论研究和技术应用较多,但尚未提出有效的方法来简化关键词的分析过程。@关键词,并没有完善的机制来管理关键词 优化策略和进度。基于上述需求,本发明提出一种基于约束条件的聚类算法,实现搜索引擎关键词优化。

  技术实现要素:

  本发明针对关键词优化和搜索引擎优化实现的技术问题,提供了基于约束条件的搜索引擎关键词优化实现。

  为解决上述问题,本发明通过以下技术方案实现:

  第一步:根据公司业务确定核心关键词,利用搜索引擎采集相关关键词。这些关键词在搜索引擎中都有相应的数据项,如全国每月搜索量、竞争程度、预估每次点击费用(CPC)等。

  第二步:结合公司产品和市场分析,对上述搜索中找到的相关关键词集进行过滤降维;

  Step 3:对于降维过滤后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页页数和总搜索页数,即每个 关键词 由五维向量组成,然后降为四维。

  Step 4:基于约束的聚类算法,对上述关键词进行聚类处理。具体的子步骤如下:

  步骤4.1:使用基于ε的k-means算法初始化集群;

  步骤4.2:初始化每个ε域的信息量函数,根据以下判断条件从数据对象集D中选择k个初始聚类中心;

  Step 4.3: 重新分配关键词i(i∈(1,2,...,m))的每一类,根据概率函数p(i)选择聚类中心j′ ;

  步骤4.4:根据确定函数Δ(I)的结果,重新计算每个聚类中心;

  步骤4.5:如果聚类中心发生变化,转步骤4.2,否则迭代结束,输出聚类结果。

  第五步:根据企业的具体情况,整合关键词效率优化和价值比优化,选择合适的关键词优化策略,实现网站优化目标。

  本发明的有益效果是:

  1、该算法可以简化关键词的分析过程,从而减少整个网站的优化工作量。

  2、该算法运行时间复杂度低,处理速度较快。

  3、这个算法有更大的使用价值。

  4、可以帮助网站在短时间内快速提升其关键词的排名。

  5、 给企业带来一定的流量和查询量网站,从而达到理想的网站优化目标。

  6、该算法从相关度上区分每个类,分类结果的准确性更符合经验值。

  7. 考虑了各个字段的整体比例,可以减少异常值对聚类结果的影响。

  8、 数据处理效果更好。

  图纸说明

  图1 基于约束的聚类算法实现的搜索引擎关键词优化结构流程图

  图2 基于约束条件的聚类算法在聚类分析中的应用流程图

  详细方法

  为解决关键词优化实现搜索引擎优化的技术问题,结合图1至图2对本发明进行详细说明,具体实现步骤如下:

  第一步:根据公司业务确定核心关键词,利用搜索引擎采集相关关键词。这些关键词在搜索引擎中都有相应的数据项,比如全国每月的搜索量、竞争程度、估算的每次点击费用(CPC)等。

  第二步:结合公司产品和市场分析,对上述搜索中找到的相关关键词集进行过滤降维;

  Step 3:对于降维过滤后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页页数和总搜索页数,即每个关键词由五个维度向量再次缩减为四个维度,具体计算过程如下:

  这里,相关关键词的个数为m,有如下m×5矩阵:

  Ni、Ldi、CPCi、NiS、NiY分别为对应的国内月搜索量、竞争水平、预估CPC、首页页数、第i个关键词对应的总搜索页数@> 按顺序。

  然后降维到四维,即

  Xi ∈ (1, 2, ..., m) 为搜索性能,Zi ∈ (1, 2, ..., m) 为取值率,公式如下:

  Step 4:基于约束的聚类算法,对上述关键词进行聚类处理。具体的子步骤如下:

  步骤4.1:使用基于ε域的k-means算法初始化c簇。

  步骤4.2:用值[0,1]之间的数字初始化隶属矩阵J,满足隶属关系的整个约束。具体计算过程如下:

  上式为第i个关键词向量与空间中簇中心向量的内积,μij为关键词i属于j类的度系数,满足如下隶属约束:

  初始隶属度矩阵 J 为 m×c:

  步骤4.3:初始化各域的目标函数,构造类别c的总目标函数,积分隶属约束,构造m个方程,求解得到聚类结果。具体计算过程如下:

  上式 nεj 是类型 j 的 ε 字段中数据对象的数量。

  类型 c 的总目标函数是

  综合隶属度约束并构造 m 个方程:

  这里 λi(i∈(1,2,...,m)) 是 m 个约束的拉格朗日乘数。对所有输入参数求导可以得到达到最大值的必要条件cj和μij;

  上式xi为关键词i对应的向量;

  Step 4.4: 用下面的公式确定函数Δ(I)的结果重新计算每个簇的中心。具体计算过程如下:

  决策函数 Δ(I):

  上式为新的总目标函数,即上次迭代得到的总目标函数。θ是一个足够小的数,只有满足上述条件,才能找到最佳分类,否则找不到。

  基于约束的聚类算法的具体结构流程如图2所示。

  第五步:根据企业的具体情况,整合关键词效率优化和价值比优化,选择合适的关键词优化策略,实现网站优化目标。

  基于约束条件的聚类算法实现搜索引擎关键词的优化及其伪代码过程

  输入:网站Extracted core关键词,根据ε字段初始化为c类型

  输出:全局总目标函数之和最大的 c 个集群。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线