实证研究:搜索关键词确定的主要依据和依据研究
优采云 发布时间: 2021-07-19 00:08实证研究:搜索关键词确定的主要依据和依据研究
第 5 章实证研究
在选择变量、构建模型、提出假设的基础上,进行本文的实证研究。首先是采集数据,利用SPSS16.0软件对采集到的数据进行分析,包括描述性统计分析、因子分析、相关分析。最后使用SPSS16.0统计软件对数据进行回归分析。本文提出的假设得到检验。
5.1 数据采集。
5.1.1 请务必搜索关键词。
为了搜索到合适的网站,获得更有效的数据,必须先搜索关键词。搜索关键词在百度搜索中应该是有代表性的,也能充分体现企业搜索引擎优化的效果。搜索关键词的主要依据如下:
(1)是数据统计的准确性和方便性。搜索关键词作为标题,长尾关键词,Meta描述中的核心关键词是独立的词,无法进一步细分.如果关键词也可以分词,容易引起异议,因为我们无法准确知道每一个网站要优化关键词的关键点,只能以这个搜索关键词为核心调研关键词。调研用户按这个关键词搜索时,百度搜索引擎排名靠前的网站具体的搜索引擎方法是什么,会带来怎样的优化效果。
(2)此关键词应该能够体现企业搜索引擎优化的效果。大型品牌企业都有自己的知名度,网站即使不太多也能在搜索引擎搜索结果中取得不错的排名优化。因此,研究排名靠前的中小企业的搜索引擎优化更有意义。
(3)此关键词在搜索引擎中搜索量大,搜索结果页面多。根据中国互联网络信息中心发布的《2014年中国网民搜索行为研究报告》( CNNIC),目前用户搜索引擎使用场景更多是休闲娱乐,用户在寻找或下载电影、音乐、小说、游戏等娱乐资源时,搜索比例达到79.7%,而使用搜索引擎查找购物信息的用户占比为70.9%,仅次于查找下载娱乐资源的使用率,因此此次关键词的范围主要是娱乐购物信息。娱乐的实时性,不同时间排名会有很大差异,所以关键词锁定购物。
(4)百度搜索与购物相关的风云榜有:生活类、汽车、科技、家电等。其中只有“旅游”、“团购”、“奢侈品” ”和“生活类食品”“化妆品”五个列表根据用户在百度搜索输入框中对关键词的搜索次数和搜索量排名得到的搜索索引构建相应的列表.
根据以上分析,确定“化妆品”搜索的是关键词。 关键词涉及的产品没有严格的地域性,搜索用户群体广泛。 “化妆品”没有分词,在百度搜索引擎中搜索量非常大,可以充分反映用户的搜索行为。根据百度搜索的关键词,搜索结果中出现的公司类型也有很大差异,因此可以体现一定的搜索引擎优化效果,那么探索搜索引擎优化的方法和效果就变得有意义了。
5.1.2 企业定义。
本文主要是对企业搜索引擎优化的方法和效果的实证研究。由于中小企业的资金、品牌号召力和市场份额都比大企业少,搜索引擎优化对于中小企业来说具有成本低、灵活性高等优点。更适合企业。通过搜索引擎优化,提升网站在搜索引擎中的排名,搜索引擎可以为企业带来用户。因此,我们的研究重点是中小企业的搜索引擎优化。
在界定大中小企业类别时,主要参考国家统计局制定的大、中、小、微型企业分类方法。根据行业类型,根据从业人员、营业收入、总资产等指标确定企业类型。具体分类标准见附录1。数据来自国家统计局。因为本文主要研究搜索引擎优化方法与中小企业优化效果的关系。在选择统计数据时,在寻找公司员工、营业收入、总资产等指标时,必须根据行业类别确定公司类型,不能记录大网站的排名。
目前,业务类型的分类仅按行业类别进行定义,并未具体按某一类别进行分类。因此,本文在界定企业时,主要参考国家统计局制定的大、中、小、微型企业分类标准。例如,如果根据关键词“化妆品”进行百度搜索,在采集数据时,首先要找到相关化妆品公司所属的行业。然后汇总公司的员工人数、营业收入等指标。最后,根据这些企业所属的行业类别和区分指标,确定化妆品企业的类型。
5.1.3 数据采集过程。
确认搜索关键词并定义公司后,必须进行数据采集。本文基于百度搜索引擎优化方法研究,所以网站采集自百度搜索引擎,网站相关数据采集自web服务器和权威第三方网站。采集的数据由360安全浏览器、百度搜索引擎平台、站长工具-站长之家等第三方网站选择。
数据采集过程主要包括:百度搜索,记录网站网址;获取网站相关数据;数据筛选,获得最终的实证分析数据。
(1)百度搜索,记录一个有效的网站地址。百度搜索使用“化妆品”为关键词,选择搜索结果页的前60页,在搜索结果 百度的相关网址。在这个过程中,没有记录百度推广网址和百度下网址,如*敏*感*词*、百度文库、百度糯米等百度产品,最终获得400个网址。
(2)获取网站相关数据。搜索引擎优化方法和效果的相关数据主要来自站长工具-站长之家的SEO综合查询。部分数据通过网速测试网站,等补充查询采集相关数据进行搜索引擎优化,有以下考虑:搜索结果显示网站普通页面。对于导入链接、百度收录数、日均IP访问量三个指标是网站的整体数据,长尾关键词,Title中关键词的数量,Meta描述中关键词的数量,内部链接,百度自然排名记录搜索结果百度快照页面数据的五个指标。关键词密度记录关键词搜索次数占页面总字数的比例,以百分比表示。
页面打开速度是指打开网站homepage的速度,可以通过第三方测试网站输入网站域名地址获得。本工具测试作者使用的浏览器发起连接搜索企业网站服务器的响应速度。 404错误页面的数据获取方法是打开找到的400个网站地址对应的网页,在URL末尾添加字符(如添加000),然后刷新重新打开,直到404错误page出现 到此为止,记录404错误页面的类型,如果出现的404错误页面是服务器默认的,则记录为“0”。如果是自定义的,有错误提示或者可以引导查看者继续浏览,记录为“1”。
由于数据在不断变化,本研究的数据采集于 2015 年 9 月 29 日。
(3)数据过滤。对采集到的400组数据进行过滤,删除缺少重要变量的网址,以及网站相同的不同网页,但只保留第一个网页的网址。同时,删除阿里巴巴、58同城、赶集网、知名化妆品品牌、国家食品药品监督管理局等网站websites,最终得到115组数据,对应的URL见附录2。 指标这115组数据中,基本可以反映企业搜索引擎优化的方法和效果具有代表性。
5.2 描述性统计分析。
采集整理好数据后,需要对数据进行实证分析。本文研究了关键词密度,企业搜索引擎优化方法中长尾关键词的数量,Title中关键词的数量,Meta描述中关键词的数量,以及搜索结果对应的页面八种内链方法,网站import链接,404错误页面,网站homepage打开速度,以及搜索引擎优化效果百度收录数,百度自然排名的页面数定位,以及日均IP访问量,首先对八种搜索引擎优化方法进行描述性统计分析。主要是频率分析,确定原创数据的总体情况,描述数据的集中趋势和离散趋势。考虑到百度收录数和日均IP流量数据中搜索引擎方法中的内链、外链、搜索引擎效应都比较大,为了减少异方差[57],这些的自然对数取了四个数据。获取搜索引擎优化方法的描述性统计分析。
关键词密度的平均值为2.558%,标题和Meta标签中的长尾关键词约为5个,标题中关键词的数量约为1,@ Meta描述中关键词的数量大约为2个,搜索结果的百度快照页面对应的大约有187个(e5.23)内部链接),网站的数量导入链接约59个(e4.07)404错误页面的平均值为0.57,网站homepage打开速度的平均值为0.3036s。这些数据反映了基本值共115个网站搜索引擎优化方法,为接下来的分析做准备。
5.3 因子分析。
(1)KMO 和 Bartlett 球体测试。
在进行因子分析之前,首先要确定该变量是否适合进行因子分析,主要通过KMO和Bartlett's sphere test来衡量。本研究首先分析搜索引擎优化方法,关键词密度,长尾关键词,标题中关键词的数量,Meta描述中关键词的数量,内部链接,导入链接,404错误pages和页面打开速度这8个变量通过KMO检验和Bartlett sphere检验来判断这8个变量是否适合进行因子分析。
搜索引擎优化方法的8个变量的Bartlett sphere test卡方值为280.599,对应的显着性概率P值为0.0000.5,所以8个变量的搜索引擎优化方法可以对每个变量进行因子分析,进一步完成主成分分析。
(2)主成分分析。
因子分析最常用的方法是主成分分析。主成分分析考虑变量之间的关系,采用降维的方法将多个变量转化为几个不相关的因子,得到一个共同的Factor,便于进一步研究。本文主成分分析的主要目的是选取公因子和查看初始因子载荷矩阵。如果初始初始载荷矩阵不能让变量基于公因子的贡献产生更明显的分级,则进行因子旋转并通过旋转因子载荷矩阵查看。
提取公因子主要通过特征值和累积方差贡献率来完成。
表的第一列中有八个因子。一般选择特征值大于1的因子作为主要因子。前四个因子满足条件,特征值为2.491、1.452、1.196、1.013.,前四个因子累积解释方差为76.909%,所以总体效度好,可以准确衡量各个变量的意义。
通过SPSS16.0对数据进行主成分分析,提取公因子,得到初始因子载荷矩阵。
影响第一因子的四个主要变量分别是关键词密度、长尾关键词、Title中关键词的数量和Meta描述中关键词的数量,以及它们的主成分因子负载量分别为0.565、0.914、0.729 和0.850。这四个变量主要是关于关键词的描述。
因为title和Meta标签有一定的长度限制,太长会被搜索引擎拦截,所以企业应该考虑把自己的重点和满足用户需求放在这些地方的顶部关键词 , 提高被用户发现的概率。当用户输入关键词进行搜索时,搜索引擎会快速找到与用户关键词匹配的网页,并根据相应的排名算法进行排名。搜索结果页面会显示相应的结果列表,用户看到如果搜索关键词,就会点击进入,浏览访问或达成购买意向。放长尾关键词的目的是为了提高转化率。长尾关键词一般比较长,至少是两个关键词的组合。使用这个关键词的客户一般都有更明确的需求,所以营销目的更容易实现。当然一定要控制关键词的数量,控制关键词的密度,不要堆关键词,过度优化,第一个因素是很好衡量关键词指标在搜索中的数量引擎优化方法。
影响第二个因素的变量是内链。该变量的主成分因子载荷为0.850,即内部链接的描述。 网站内部链接由网站管理器部署,可控性强。
内链不仅会影响网站被搜索引擎抓取索引效率,还会影响用户体验。所以企业网站一定要做好内链优化。内链部署的越优秀,页面被点击的机会越大,浏览量增加越明显,比如在网站添加相关文章和热门文章,定期更新文章内容等。内部链接可以轻松提高用户的访问体验。 网站每个页面都有一定的内链数量限制。太多的内部链接可能会被搜索引擎忽略。基于此,第二个因素是衡量搜索引擎优化方法中内链数量的一个很好的指标。
影响第三个因素的变量是导入链接。该变量的主成分因子负载为0.696,即导入链接和返回链接的描述。导入链接是另一个网站投票给你的网站,它会增加你的网站在搜索引擎中的权重,从而提高在搜索引擎中的自然排名。该指标可以反映调查公司的导入链接数,可以作为搜索引擎优化的重要手段。
影响第四个因素的变量是404错误页面和页面打开速度。这两个变量的主成分因子负载分别为0.705和0.565,主要是对页面设计的描述。 404错误页面是指向用户返回无法访问的网页或域名错误等信息的页面。自定义的404错误页面可以引导用户继续访问网站其他内容,而不是关闭网站离开。 网站 建设者要更加注重页面设计,设计定制的404错误页面,提高网页打开速度。第四个因素更能反映网站页面设计的情况。
通过以上分析可以看出,未旋转公共因子的实际含义已经得到很好的解释,具有很强的现实意义,因此不需要进行因子旋转。本文提取公因子的主要目的是检测搜索引擎方法的各个维度是否存在严重的交叉性,但通过主成分分析发现,大部分维度较为合理,但存在一定的量划分变量时的统计数据。偏差,对衡量搜索引擎优化效果的影响相对较小,可以忽略。因此,在接下来的实证分析过程中,搜索引擎优化方法的八个维度仍在研究中。
5.4 相关分析。
为了探索影响搜索引擎优化效果的优化方法,需要对搜索引擎优化方法变量和搜索引擎优化效果变量进行相关分析。相关分析是一种分析方法,用于研究两个或多个变量之间是否存在相关性,探索特定相关现象之间的相关方向和相关程度[58](马国庆,2002)。因为总体分布变量值未知,本文采用spearman系数进行变量相关分析和计算。
(1)百度收录数的搜索引擎优化方法及相关分析。
<p>关于关键词密度,搜索引擎优化方法中的长尾关键词,Title中关键词的数量,Meta描述中关键词的数量,内部链接,导入链接,404错误页面,页面打开速度与百度收录数的分析结果有关。 关键词密度、Meta描述中关键词的数量与百度收录的数量在0.05、Title、内部链接、导入中关键词的数量水平上呈显着正相关链接、404错误页面与百度收录数在0.01的水平上有显着的正相关。所以关键词密度、Title中关键词的数量、Meta描述中关键词的数量、内部链接、导入链接、404错误页面都与百度收录数有一定的相关性。