【每日一题】5.5回归分析(一)——多重共线性
优采云 发布时间: 2021-08-13 20:11【每日一题】5.5回归分析(一)——多重共线性
5.5 回归分析。
回归分析是一种确定两个或多个变量之间线性或非线性关系的分析方法。
如果回归分析中只有一个自变量,则为单变量回归分析。如果有多个自变量,则为多元回归分析。本文主要进行多元回归分析,试图找出变量之间的关系,判断模型中的假设是否有效。为了保证回归模型的准确性,在进行多元回归分析检验多个自变量与因变量之间的关系时,首先要对自变量进行多重共线性分析。所谓多重共线性是指线性回归模型中的自变量之间存在一定的相关性。本文使用两种常用的测试方法来衡量方差膨胀因子(VIF)和容差(Tolerance)。当采用逐步回归法(Stepwise)和强制进入法(Enter)进行多元回归时,当自变量的方差扩展因子小于10时,容差大于0.1,说明有变量之间不存在强多重共线性。
5.5.1 搜索引擎优化方法与百度收录数的回归分析。
为了检验搜索引擎优化方法对百度收录数的影响,以搜索引擎优化方法八个变量的第一项为自变量,百度收录进行多元回归分析数作为因变量。自变量之间不存在严重的多重共线性问题,满足线性回归的假设。自变量的最小容差为0.183,大于0.1;最大VIF为5.452,小于10。综合考虑这两方面,模型的共线性问题不是很严重,模型是可取的。
根据关键词密度,长尾关键词,Title中关键词的数量,Meta描述中关键词的数量,内部链接,导入链接,404错误页面,页面打开速度八变量 的主项是自变量,百度收录number 是因变量。当显着性水平为0.000时,模型的F值为15.160,说明模型拟合良好。错误页面的sig值和页面打开速度分别为0.150和0.207,均大于0.05,未通过显着性测试。这两个变量对百度收录数没有显着影响,H7、H8假设不成立。在回归模型中,内部链接对应的显着性sig为0.000,小于0.05,Beta标准化回归系数为0.308,说明内部链接对百度@有正向影响收录数。假设H5成立。内部链接的t值为3.803,达到0.05的显着性水平。在回归模型中,导入链接对应的显着性sig为0.000,小于0.05,Beta标准化回归系数为0.505,说明导入链接对百度收录数。假设H6成立。导入链接的t值为7.015,达到0.05的显着性水平。调整后的R2为0.498,说明搜索引擎优化方法可以解释49.8%的百度收录数变,方程拟合良好。
假设关键词密度、长尾关键词、Title中关键词的数量、Meta描述中关键词的数量和百度收录的数量倒U,依次为为了验证这种关系,将关键词密度的平方项、长尾关键词平方项、Title中关键词数的平方项和Meta描述中关键词数的平方项添加到模型中依次得到回归分析结果。 , 只记录可以验证假设的数据。
<p>关键词密度平方项的sig值为0.217,大于0.05,未通过显着性检验。 关键词密度与百度收录数倒U的关系不显着,H1假设不成立。 关键词密度t值为3.180,sig值为0.002,Beta标准化回归系数为0.272,说明关键词密度对百度收录数有正向影响。