关键词采集词( 本文不讨论这类的纵向拓展(纵向扩展词的定义))
优采云 发布时间: 2021-10-27 08:11本文不讨论这类的纵向拓展(纵向扩展词的定义))
本文转载
众所周知,SEO的第一步是准备关键词词库。关键词的获取方式有很多,比如采集下拉框和相关搜索,采集竞争对手的字典,甚至更高效的直接使用搜索引擎API构建词库等。 等待。
假设你现在需要新建一个词库,至少需要有一批词根进行第一轮相关的关键词扩展。对于大部分朋友来说,root其实就是产品名称,比如mp3、iphone、galaxy s3等。本文不讨论此类词根的垂直扩展(垂直扩展词的定义:类似于mp4作为mp3的相关搜索词,北京旅游作为南京旅游的相关搜索词,我们在这里将其定义为垂直扩展词; 横向扩展词的定义:类似于mp3 player price作为mp3的相关搜索词,南京旅游景点作为南京旅游的相关搜索词,即扩展词A收录词根B,我们将其定义为这里是水平扩展项),
整理出一批属性相同的根列表(比如mp3、mp4、mp5,它们都是视频播放器,可以看作是统一聚类进行分析,因为搜索到的用户是同一群人。其他的)比如北京水立方、常州恐龙园、苏州游乐园也属于同属性的词根),我们可以使用一些工具(比如光年百度推广关键词获取工具)来拓展词根。在得到结果之前,我们都非常高兴,但大多数人在得到结果后都崩溃了。因为大多数人的根目录从几千到几万不等,展开的结果不到10万。当数据量较小时,我们可以手动提取单个单词的长尾和后缀,
至此,如果我们要分析长尾关键词前缀和后缀,第一步是将水平扩展后的词库的根去掉,得到前缀和后缀部分。批量去根的方法有很多,比如shell,但是我更喜欢excel,毕竟非常方便直观。
在打开的excel表中,我们假设sheet1存储了关键词词库,sheet2存储了1000个词根。
接下来,我们输入要收录在 sheet1 的单元格 C1 中的根,并在单元格 C2 中输入以下数组函数 {=INDEX(sheet2!$A$2:$A$1000,MATCH(TRUE,ISNUMBER(FIND(sheet2!$A$2) :$A$1000,A2,1)),0))}(注意一定要写match_type=0,否则这个程序会报错),然后双击填写所有的当当当,所有根横向展开的长尾关键词都会出现鸟。接下来要做的就是过滤,查看#N/A部分,把所有的长尾都横向展开< @关键词啦。
接下来我们要做的就是在sheet1的D1和E1单元格中输入长尾前缀和长尾后缀。然后在单元格 D2 和 E2 中输入以下函数: =LEFT(A2,FIND(C2,A2)-1) and =RIGHT(A2,LEN(A2)-FIND( C2 ,A2)-LEN(C2)+1)。然后双击将所有单元格向下填充。至此我们得到了长尾关键词@的所有前端> 后缀!
但这里要考虑的另一件事是,尽管根列表是唯一的,但它可能是独立的。比如我的root中有两行数据,“西湖”和“瘦西湖”。这两个词代表两个不同的景点,但都收录同一个词,即“西湖”。所以如果我们在root所在的sheet2上不做任何处理,去除root的时候可能会出现偏差。例如,匹配sheet1中“瘦西湖门票价格”这一行的根时,根“西湖”和“瘦西湖”的命中为TRUE。这时候MATCH函数会返回sheet2中第一个单词出现的行数。如果“西湖”的根列表中的行数
那么如何避免这个问题其实很简单。首先我们在root所在的sheet2上进行自收录查询,新建一列数据,假设是B列,在B2中填写如下数组函数公式进行自收录查询,然后在下面填写: {=COUNT(FIND(A2,$A$2:$A$1000))}
这个函数得到的数字可以理解为这样一个过程:你ctrl+c复制单元格然后ctrl+f调出搜索选项框,然后ctrl+v粘贴最后点击行数全部查找后得到的结果。
此外,尽可能拉伸选定的绝对列数据,以避免将来向表中添加新数据。然后过滤看看有没有自成体系。如果root不存在self-contained,那么谢天谢地你什么都不用做,但是如果它存在,则创建一个新列,假设它是C列,并在C2中填写以下公式:=LDN (a2),然后向下填充。最后将表中所有数据按照列的字符串长度降序排序。
这可以解决上述西湖和瘦西湖问题的原则是:先长词。
最后一步用excel自带的数据透视图就OK了。操作很简单,所以直接上图。至此,我们已经完成了词库从获取到过滤掉水平长尾关键词,到去根切到长尾关键词前缀和后缀,以及生成的全过程数据报告出来了。