基于约束条件的聚类算法实现搜索引擎关键词关键词优化(图)
优采云 发布时间: 2021-08-19 22:35
基于约束条件的聚类算法实现搜索引擎关键词关键词优化(图)
本发明涉及语义网络技术领域,具体涉及一种基于约束条件的聚类算法,实现搜索引擎关键词优化。
背景技术:
搜索引擎已经成为网民获取信息的重要工具。搜索引擎优化(SEO)是指利用相关技术对网站进行优化,提高相应关键词在搜索引擎上的排名,最终达到网站营销的目的。实际上,搜索引擎优化是一种网络营销形式,允许企业利用主要的搜索引擎优化策略,对关键词、内容、网页中的链接等各种因素进行优化,以便应用该策略后的公司网站可先被各大主流搜索引擎和收录抓取,在索引目标页面中排名靠前,吸引点击率,从而达到提升企业形象,宣传网站的目的。在目前所有的网络营销形式中,搜索引擎优化无疑是在短时间内扩大企业影响力和提升企业形象的最佳方式网站。 SEO归根结底就是对关键词的优化。 关键词是用户搜索相关页面时使用的词或词组,也是搜索引擎建立索引表时使用的词。使用关键词 有助于获得更高的搜索引擎查询排名。需要注意的是,关键词 研究旨在寻找最有价值的关键词。目前,*敏*感*词*对关键词优化的理论研究和技术应用较多,但还没有提出一种有效的方法来简化关键词分析过程,也没有完善的管理关键词优化的机制战略和进展。基于上述需求,本发明提出一种基于约束条件的聚类算法,实现搜索引擎关键词优化。
技术实现要素:
本发明针对关键词优化实现搜索引擎优化的技术问题,提出基于约束条件实现搜索引擎关键词优化。
为解决上述问题,本发明是通过以下技术方案实现的:
第一步:根据企业的业务确定核心关键词,利用搜索引擎采集相关关键词。这些关键字在搜索引擎中都有相应的数据项,例如每月搜索量、竞争水平和估算的每次点击费用(CPC)等。
第2步:结合公司产品和市场分析,对上述搜索中找到的相关关键词集进行过滤降维;
第三步:对于降维过滤后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页页数和搜索页总数,即每个关键词由一个五维向量再现 降维是四维的。
第四步:基于约束的聚类算法,对上述关键词进行聚类处理,具体子步骤如下:
步骤4.1:使用基于ε字段的k-means算法初始化集群;
步骤4.2:初始化每个ε域的信息量函数,根据以下判断条件从数据对象集D中选择k个初始聚类中心;
步骤4.3:重新分配每个类关键词i(i∈(1, 2,..., m)),根据概率函数p(i)选择聚类中心j′;
步骤4.4:根据判定函数Δ(I)的结果,重新计算每个簇的中心;
步骤4.5:如果聚类中心发生变化,则转到步骤4.2,否则迭代结束,输出聚类结果。
第五步:根据企业的具体情况,整合关键词效率优化和价值率优化,选择合适的关键词优化策略,实现网站优化目标。
本发明的有益效果是:
1.该算法可以简化关键词分析过程,从而减少整个网站优化工作量。
2、该算法运行时间复杂度低,处理速度快。
3、这个算法有更大的使用价值。
4、可以帮助网站在短时间内快速提升其关键词排名。
5、给企业网站带来一定的流量和查询,从而达到理想的网站优化目标。
6、该算法从相关度上部分区分了每个类,分类结果的准确性更符合经验值。
7、考虑各个字段的整体比例,可以减少异常值对聚类结果的影响。
8、数据处理的效果更好。
图纸说明
图1 基于约束聚类算法的搜索引擎关键词优化结构流程图
图2 基于约束条件的聚类算法在聚类分析中的应用流程图
具体实现方法
为解决关键词optimization实现搜索引擎优化的技术问题,结合图1至图2对本发明进行详细说明,具体实现步骤如下:
第一步:根据企业的业务确定核心关键词,利用搜索引擎采集相关关键词。这些关键词在搜索引擎中都有相应的数据项,比如每月的搜索量、竞争程度和估算的每次点击费用(CPC)等。
第2步:结合公司产品和市场分析,对上述搜索中找到的相关关键词集进行过滤降维;
第三步:对于降维过滤后的关键词集合,通过搜索引擎搜索关键词对应的页面,这里记录首页页数和搜索页总数,即每个关键词由一个五维向量复现降维为四维,具体计算过程如下:
这里关联的关键词个数为m,有如下m×5个矩阵:
Ni、Ldi、CPCi、NiS、NiY分别为i-对应的国内月搜索量、竞争水平、预估每次点击费用(CPC)、首页页数、总搜索页数第关键词。
维度缩减为四个维度,即
Xi∈(1,2,...,m) 为搜索性能,Zi∈(1,2,...,m) 为取值率,公式如下:
第四步:基于约束的聚类算法,对上述关键词进行聚类处理,具体子步骤如下:
步骤4.1:使用基于ε字段的k-means算法初始化c簇。
步骤4.2:用值[0,1]之间的数字初始化隶属矩阵J,以满足隶属度的整个约束。具体计算过程如下:
上式为第i个关键词向量与空间中簇中心向量的内积,μij为关键词i属于j类的度系数,满足如下隶属约束:
初始化隶属矩阵J为m×c:
Step4.3:初始化各个域的目标函数,构造一个c类型的总目标函数,积分隶属约束,构造m个方程,求解得到聚类结果。具体计算过程如下:
上式nεj是j类型的ε字段中数据对象的个数。
类型c的总目标函数为
综合隶属度约束,构造m个方程:
这里 λi(i∈(1,2,...,m)) 是 m 个约束的拉格朗日乘数。对所有输入参数求导,可以得到使cj和μij最大化的必要条件;
上式xi为关键词i对应的向量;
步骤4.4:使用以下公式确定函数Δ(I)的结果,重新计算每个簇的中心。具体计算过程如下:
决策函数Δ(I):
上式为新的总目标函数,即上次迭代得到的总目标函数。 θ是一个足够小的数,只有满足上述条件,才能找到最佳分类,否则找不到。
基于约束的聚类算法的具体结构如图2所示。
第五步:根据企业的具体情况,整合关键词效率优化和价值比优化,选择合适的关键词优化策略,实现网站优化目标。
基于约束条件的聚类算法实现搜索引擎关键词优化,及其伪代码过程
输入:网站提取核心关键词,根据ε字段初始化为c类型
输出:全局总目标函数之和最大的c个簇。