改进聚类算法实现搜索引擎关键词优化的技术实现要素
优采云 发布时间: 2021-05-10 00:07
改进聚类算法实现搜索引擎关键词优化的技术实现要素
本发明涉及语义网络技术领域,尤其涉及一种实现搜索引擎关键词优化的改进聚类算法。
背景技术:
搜索引擎在增加访问网站的过程中起着至关重要的作用。当用户在Internet上搜索信息时,通常的方法是使用搜索引擎进行搜索。因此,在在线推广领域,SEO(搜索引擎优化)起着举足轻重的作用,引起了大多数网站的关注。搜索引擎优化技术包括黑帽技术和白帽技术。黑帽技术是指违反搜索引擎优化规则的恶意优化技术。在关键词优化技术中,它显示为在页面上堆叠关键词或放置无关的关键词为了提高搜索引擎的排名,当前的搜索引擎已经引入了相关技术和规则来惩罚使用黑色的网站帽子技术;白帽技术是指搜索引擎认可的一种优化技术。真正的SEO将通过使用易于搜索引擎编制索引的合理方法,使网站更加用户友好和搜索引擎友好(Search Engine Friendly),从而使搜索引擎收录和优先。商业网站的核心关键字在主流搜索引擎中排名第一,在当今的商业社会中具有非凡的价值。因此,关键字通常被称为整个搜索应用程序的基石。目前,*敏*感*词*对关键词优化的理论研究和技术应用很多,但尚未提出有效的方法来简化关键词分析过程,也没有完善的机制来管理关键词优化。战略与进步。基于上述要求,本发明提供了一种改进的聚类算法,以实现搜索引擎关键词的优化。
技术实现要素:
针对实现搜索引擎优化的关键词优化的技术问题,本发明提供了一种实现搜索引擎关键词优化的改进的聚类算法。
为了解决上述问题,本发明通过以下技术方案来实现:
第1步:根据公司业务确定核心关键词,并使用搜索引擎采集相关关键字。这些关键字在搜索引擎中具有相应的数据项,例如每月搜索量,竞争水平和估算的每次点击费用(CPC)等。
第2步:结合公司的产品和市场分析来过滤在上述搜索中发现的相关关键词集,以减少维度;
步骤3:对于降维过滤后设置的关键词,通过搜索引擎搜索与关键词对应的页面,在此记录首页页面数和搜索页面总数,即每个关键词都由一个五维向量组成。降维就是四维。
步骤4:使用改进的聚类算法对上述关键词进行聚类,具体子步骤如下:
步骤4. 1:使用基于ε字段的k-means算法初始化聚类;
步骤4. 2:初始化每个ε字段的目标函数,并根据以下判断条件从数据对象集D中选择k个初始聚类中心;
步骤4. 3:重新分配每个类别关键词 i(i∈(1,2,...,m)),并根据概率函数p(i)选择聚类中心j';
步骤4. 4:根据决策函数Δ(g)的结果,重新计算每个聚类的中心;
步骤4. 5:如果聚类中心发生变化,请转到步骤4. 2,否则迭代结束,并输出聚类结果。
步骤5:根据企业的具体情况,全面进行关键词效率优化和价值率优化,并选择适当的关键词优化策略,以实现网站优化目标。
本发明的有益效果是:
1,该算法可以简化关键词分析过程,从而减少整个网站优化工作量。
2,该算法运行时间复杂度低,处理速度更快。
3、该算法具有更大的使用价值。
4、可以帮助网站在短时间内快速提高其关键词排名。
5、给企业网站带来了一定的流量和查询,从而实现了理想的网站优化目标。
6、该算法分类结果的准确性更符合经验值。
7、此算法更加便捷有效。
8、数据处理效果更好。
图纸说明
图1改进的聚类算法实现搜索引擎关键词优化结构流程图
图2改进的聚类算法在聚类分析中的应用流程图
具体的实现方法
为了解决关键词优化以实现搜索引擎优化的技术问题,参考图1和图2详细描述本发明,具体实现步骤如下:
第1步:根据公司业务确定核心关键词,并使用搜索引擎采集相关的关键字。这些关键字在搜索引擎中具有相应的数据项,例如每月搜索量,竞争水平和估算的每次点击费用(CPC)等。
第2步:结合公司的产品和市场分析,以过滤在上述搜索的降维中找到的相关关键字集;
步骤3:对于降维过滤后设置的关键词,通过搜索引擎搜索与关键词对应的页面,在此记录首页页面数和搜索页面总数,即每个关键词由一个五维向量组成。降维为四维,具体计算过程如下:
这里关键词的相关个数为m,并且有以下m×5个矩阵:
Ni,Ldi,CPCI,NiS和NiY是每月搜索量,竞争水平,估算的每次点击费用(CPC),首页页数以及与第i 关键词相对应的搜索页总数]。
该维度被缩减为四个维度,即
Xi∈(1,2,...,m)是搜索性能,Zi∈(1,2,...,m)是值比率,其公式如下:
步骤4:使用改进的聚类算法对上述关键词进行聚类,具体子步骤如下:
步骤4. 1:使用基于ε字段的k-means算法初始化聚类。
步骤4. 2:初始化每个ε字段的目标函数,并根据以下判断条件从数据对象集D中选择k个初始聚类中心。具体计算过程如下:
上述公式nε是每个ε字段中数据对象的数量,并且是每个ε字段中的总紧缩度。 α和β分别是数量nε和紧密度的影响系数,α+β= 1,可以根据实验对该值进行迭代以获得合适的值。
热门样式
是空间中第i个关键词向量及其簇中心向量的内积。
判断条件如下:
γ是设定的阈值。仅当满足以上公式时,才将其分类为一个簇,然后过滤出k个类别。
步骤4. 3:重新分配每个类别关键词 i(i∈(1,2,...,m)),根据概率函数p(i)选择聚类中心j',然后计算它的过程如下:
根据p(i)的最大值选择相应的聚类中心j'。
步骤4. 4:根据决策函数Δ(g)的结果,重新计算每个聚类的中心。具体计算过程如下:
gi∈k是在第N次迭代中获得的全局目标函数,并且是在第N次迭代中第j个簇的目标函数。
Δ(g)=gi∈kN-gi∈kN-1> 0
满足上述公式,然后重新计算每个聚类的中心。
步骤4. 5:如果聚类中心发生变化,请转到步骤4. 2,否则迭代结束,并输出聚类结果。
步骤5:根据企业的具体情况,全面进行关键词效率优化和价值率优化,并选择适当的关键词优化策略,以实现网站优化目标。
改进的聚类算法以实现搜索引擎关键词优化,及其伪代码处理
输入:网站提取核关键词,根据ε字段初始化聚类,并初始化每个ε字段的目标函数
输出:k个具有最大全局目标函数gi∈k的簇。