关键词文章采集( 批量采集关键词百度指数,需要cookie池!百度账号cookie为“BDUSS=xxx”)

优采云 发布时间: 2021-08-30 15:00

  关键词文章采集(

批量采集关键词百度指数,需要cookie池!百度账号cookie为“BDUSS=xxx”)

  Python关键词百度index采集,抓包Cookie和json数据处理

  1.抓包处理

  2.Cookie 使用添加

  3.json 数据处理转换

  百度指数是基于百度海量互联网用户行为数据的数据分析平台。是当前互联网乃至整个数据时代最重要的统计分析平台之一。自发布之日起,它就成为了许多公司的营销决策。重要参考。

  #关键词百度指数采集

#20191119 by 微信:huguo00289

# -*- coding: UTF-8 -*-

import requests,json,time

def get_index(keyword,cook):

headers={

'Accept': 'application/json, text/plain, */*',

'Accept-Encoding': 'gzip, deflate',

'Accept-Language': 'zh-CN,zh;q=0.9',

'Connection': 'keep-alive',

'Cookie': cook,

'Host': 'index.baidu.com',

'Referer': 'http://index.baidu.com/v2/main/index.html',

'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36',

'X-Requested-With': 'XMLHttpRequest',

}

#keyword="seo"

url=f'http://index.baidu.com/api/SearchApi/index?word={keyword}&area=0&days=30'

response=requests.get(url,headers=headers).text

time.sleep(2)

#req=requests.get(url,headers=headers).json() #转换为json

req=json.loads(response) #转换为json

print(req)

print(req['data']['generalRatio'][0])

for k,v in req['data']['generalRatio'][0].items():

print(k,v)

data=req['data']['generalRatio'][0]

all_avg=data['all']['avg'] #百度指数

pc_avg=data['pc']['avg'] #百度pc端指数

wise_avg=data['wise']['avg'] #百度移动端指数

print(f'百度指数:{all_avg}')

print(f'百度指数:{pc_avg}')

print(f'百度指数:{wise_avg}')

if __name__ == '__main__':

keyword=input('请输入要查询百度指数的关键词:')

cook =input('请添加百度账号的cookies:')

get_index(keyword, cook)

  

  批量采集关键词百度索引,需要cookie池!

  百度账号cookie为“BDUSS=xxx”

  百度指数是百度大数据的一种统计方法。以数据的形式呈现关键词在百度上的每日搜索量,让您更好的了解每个关键词的搜索量。

  百度索引有什么用?

  1:查询关键词热度

  百度指数可以直观的看到每个关键词的热度。指数越高,该词的商业价值越高。

  2:查询趋势

  当你放大指数的时间,你会发现关键词的整体趋势是上升还是下降?它将帮助您对未来的业务决策做出判断。

  3:查询相关词

  点击需求图,看看搜索关键词的人都在看什么。通过分析,你可以知道每个人都在搜索什么。

  4:查看人群肖像

  点击人群画像,可以看到搜索关键词的人群画像,分为地区、年龄分布、性别分布。

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线