汇总:Python关键词数据采集案例,5118查询网站关键词数据采集

优采云 发布时间: 2022-12-26 11:27

  汇总:Python关键词数据采集案例,5118查询网站关键词数据采集

  对于seoer来说,关注网站的关键词数据,关键词的排名,流量的来源,同行的网站数据是非常重要的,所以使用seo查询工具也是非常有必要的。 比较知名的有爱站龙工具、站长工具和5118。

  当然现在5118更全面,应用更广泛!

  在数据和功能上,5118很强大!

  可以的话就付钱!

  5118的抗爬还是很不错的!

  需要登录采集,发现5118更新了一次!

  比如登录账号需要经过滑块验证码的反爬限制,关键词索引等数据都以图片加密的形式展示。 这个人渣破解不了,我也怕。 .

  不过有些数据还是可以参考的! 所以,让 python 起来!

  查一个设计网站,设计成瘾的关键词

  抓取网址:

  如果您不是付费会员,您只能查看前100页的数据!

  很多数据都是反爬限制,有点可惜!

  虽然5118会员登录有滑块验证码,但是cookies登录还是非常好用的!

  我们手动添加 cookie 以登录以采集所需数据。

  几个关键点:

  1. 添加协议头:

  headers={

'Accept': 'application/json, text/javascript, */*; q=0.01',

'Accept-Encoding': 'gzip, deflate, br',

'Accept-Language': 'zh-CN,zh;q=0.9',

'Connection': 'keep-alive',

'Content-Length': '0',

'Cookie': Cookies,

'Host': 'www.5118.com',

'Origin': 'https://www.5118.com',

'Referer': 'https://www.5118.com/',

'User-Agent': ua,

'X-Requested-With': 'XMLHttpRequest',

}

  添加 ua 和 cookes 自己!

  当然这是一个完整的协议头,有些可以删掉,大家可以自己试试!

  2.zip函数的使用和格式化数据的处理之前有分享过!

  for keyword,rank,title,link,index_link in zip(keywords,ranks,titles,links,index_links):

data=[

keyword,

rank.xpath('string(.)').strip().replace(' ','').replace('rn','-'),

self.get_change(rank),

title,

unquote(link.split('target=')[-1]),

'https:{}'.format(index_link),

]

print(data)

  3.排名波动的处理

  通过源码查询可以知道,绿色表示排名上升,红色表示排名下降。 这里有一个判断就搞定了!

  #判断排名是否提升

def get_change(self,rank):

rank=etree.tostring(rank).decode('utf-8')

if "red" in str(rank):

change="下降"

elif "green" in str(rank):

change = "提升"

else:

change = "不变"

return change

  4.将关键词数据写入csv

  写了一个案例,发现了两个参考案例

  import csv

#关键词数据写入csv

def write_keywords(self):

path='{}_keywords.csv'.format(self.file_name)

csvfile = open(path, 'a+')

for keyword in self.keyword_datas:

csvfile.write('%sn' % keyword)

print("5118关键词搜索数据写入csv成功!")

#参考一

def write_csv(self):

path = "aa.csv"

with open(path, 'a+') as f:

csv_write = csv.writer(f)

data_row = ["1", "2"]

csv_write.writerow(data_row)

# 参考二

def wcsv(self):

<p>

csvfile = open('csvtest.csv', 'w')

writer = csv.writer(csvfile)

writer.writerow(['keywords'])

data = [

('1', 'http://www.xiaoheiseo.com/', '小黑'),

('2', 'http://www.baidu.com/', '百度'),

('3', 'http://www.jd.com/', '京东')

]

writer.writerows(data)

csvfile.close()</p>

  5、查询网站相关关键词数据,写入excel表格

  使用第三方库,xlsxwriter

  #数据写入excle表格

def write_to_xlsx(self):

workbook = xlsxwriter.Workbook('{}_search_results.xlsx'.format(self.file_name)) # 创建一个Excel文件

worksheet = workbook.add_worksheet(self.file_name)

title = ['关键词', '排名', '排名波动', '网页标题', '网页链接', '长尾词链接'] # 表格title

worksheet.write_row('A1', title)

for index, data in enumerate(self.data_lists):

num0 = str(index + 2)

row = 'A' + num0

worksheet.write_row(row, data)

workbook.close()

print("5118搜索数据写入excel成功!")

  由于页码也是js生成的,所以没有找到,所以自己输入页码!

  输入查询网站的URL格式为:抓取后数据存储文件使用主域名!

  附上完整代码:

  #5118网站关键词数据获取

import requests

from lxml import etree

from urllib.parse import unquote

import xlsxwriter

import time

import csv

class C5118(object):

def __init__(self,url,nums):

self.keyword_datas=[]

self.data_lists=[]

self.index_links_hrefs=[]

self.headers={

'Accept': 'application/json, text/javascript, */*; q=0.01',

'Accept-Encoding': 'gzip, deflate, br',

'Accept-Language': 'zh-CN,zh;q=0.9',

'Connection': 'keep-alive',

'Content-Length': '0',

'Cookie': Cookies,

'Host': 'www.5118.com',

'Origin': 'https://www.5118.com',

'Referer': 'https://www.5118.com/',

'User-Agent': UA,

'X-Requested-With': 'XMLHttpRequest',

}

self.post_url=url

self.file_name=url.split('.')[1]

self.pagenums=nums

#判断排名是否提升

def get_change(self,rank):

rank=etree.tostring(rank).decode('utf-8')

if "red" in str(rank):

change="下降"

elif "green" in str(rank):

change = "提升"

else:

change = "不变"

return change

#获取数据

def get_data(self,pagenum):

url="https://www.5118.com/seo/baidupc"

params={

'isPager': 'true',

'viewtype': '2',

'days': '90',

<p>

'url': self.post_url,

'orderField': 'Rank',

'orderDirection': 'asc',

'pageIndex': pagenum, #页码

'catalogName': '',

}

response=requests.post(url,params=params,headers=self.headers)

time.sleep(1)

print(response.status_code)

doc=etree.HTML(response.content.decode('utf-8'))

keywords= doc.xpath('//tr[@class="list-row"]/td[1]/a/text()') #关键词

print(keywords)

self.keyword_datas.extend(keywords)

ranks = doc.xpath('//tr[@class="list-row"]/td[2]/a') #排名

titles = doc.xpath('//tr[@class="list-row"]/td[5]/a/text()') #网页标题

links=doc.xpath('//tr[@class="list-row"]/td[5]/a/@href') #网页链接

index_links=doc.xpath('//tr[@class="list-row"]/td[7]/a/@href') #长尾词数量链接

self.index_links_hrefs.extend(index_links)

for keyword,rank,title,link,index_link in zip(keywords,ranks,titles,links,index_links):

data=[

keyword,

rank.xpath('string(.)').strip().replace(' ','').replace('rn','-'),

self.get_change(rank),

title,

unquote(link.split('target=')[-1]),

'https:{}'.format(index_link),

]

print(data)

self.data_lists.append(data)

time.sleep(4)

return self.data_lists

#关键词数据写入csv

def write_keywords(self):

path='{}_keywords.csv'.format(self.file_name)

csvfile = open(path, 'a+')

for keyword in self.keyword_datas:

csvfile.write('%sn' % keyword)

print("5118关键词搜索数据写入csv成功!")

#数据写入excle表格

def write_to_xlsx(self):

workbook = xlsxwriter.Workbook('{}_search_results.xlsx'.format(self.file_name)) # 创建一个Excel文件

worksheet = workbook.add_worksheet(self.file_name)

title = ['关键词', '排名', '排名波动', '网页标题', '网页链接', '长尾词链接'] # 表格title

worksheet.write_row('A1', title)

for index, data in enumerate(self.data_lists):

num0 = str(index + 2)

row = 'A' + num0

worksheet.write_row(row, data)

workbook.close()

print("5118搜索数据写入excel成功!")

def main(self):

for i in range(1,self.pagenums+1):

print(f'>>> 正在采集第{i}页关键词数据...')

self.get_data(i)

print("数据采集完成!")

self.write_keywords()

self.write_to_xlsx()

if __name__=="__main__":

url = "www.shejipi.com"

nums=100

spider=C5118(url,nums)

spider.main()</p>

  采集效果:

  设计迷网站关键词相关数据:shejipi_search_results..xlsx

  设计瘾网站关键词数据:shejipi_keywords.csv

  汇总:跨境王邮箱采集

  想要做好海外推广,学习Facebook营销是每个广告主的必修课。 接下来,我将从三个方面详细阐述Facebook营销的具体操作: 首先,分享一些Facebook营销技巧:

  1. 2/8 规则。这意味着在规划您的 Facebook 页面内容时,您必须确保只有

  20%的内容是“硬卖”,剩下的80%应该是其他对用户有趣、有教育意义、有价值的非营销内容。 80%的非营销内容的作用是吸引用户,覆盖20%的营销内容,所以营销信息不宜过多。 2. 在紧要关头松开。 一般来说,比较好的时间是晚上12:00到1:00。 在这段时间里,会有更多人看到你并与你互动。 但具体发布时间建议根据您的目标用户的活跃时间来确定。

  3. 更多@fans。 茫茫人海中的一个@,可以拉近粉丝与你的距离。

  4.即时回复。 现在很多消费者更喜欢直接通过Facebook与品牌沟通,人们往往更期待即时回复而不是自动回复。及时回复更有利于提高Facebook排名和赢得粉丝忠诚度

  5. 共享用户生成的内容 (UGC)。 超过 90% 的消费者在决定购买产品之前会参考 UGC。 另外,将UGC融入到营销内容中,也能让你的营销更有趣、更可信,所以平时应该多采集一些用户生成的内容。

  6.发布图文。 图文是Facebook上点赞数和转发数都很高的文章类型。 insgram采集,群发获客!跨境王邮箱采集

  跨境获客系统

  全网推广是每个营销人员都比较喜欢的一种方式,但是现在的市场竞争非常激烈,每一个推广代理都能在这方面脱颖而出,当然也会有自己独特的引流方式。 什么是全网营销获客的话题也越来越受到关注。 其实在竞争的过程中,还是实事求是比较好。 然后,您将掌握以下要点,以吸引全球访问者的流量。

  1. 对粉丝的准确度有了更大的把握。 只有锁定了粉丝群进行投放,我们才会清楚地了解这些粉丝的需求和痛点。 先分析总结,再进行全网营销获取客户,会有更好的效果。 粉丝锁定越精准,能带来的变现机会就越多。

  

  2. 真人出镜成为环球人内容的重要组成部分。 对于广大用户群体来说,对彩色隐形眼镜的信任度还不够高,市场良莠不齐。 因此,如果你想知道什么是通过网络营销获客。 必须是真人出场,通过自己的体验来使用效果,自然会得到粉丝的好评,引流效果也会越来越好。 在这个过程中,需要把握真人外表的尺度。

  3、效果比较与大力促销活动相结合。 这时候如果粉丝观察你的Globalist一段时间后,会更加关注之前使用的效果。 然后,用效果图对比上传,再推出促销活动,这时候营销效果可能会更好。

  小漫CRM可以自动发消息到whatsapp识别男女和年龄吗?

  客户需要做的就是直接在 WhatsApp 对话框中检索他们的想法。 想象一下,如果你是客户,你只需要在你习惯的界面中轻松还原几句话,甚至发送一段语音。 您愿意给商店一些反馈吗? 还可以根据用户评论,通过智能算法自动检测内容中是否存在负面信息,立即提升客户优先级,提升满意度。 场景14:Buyer Show现在是一个品牌,靠传统的单向广告,性价比更低。 通过组织活动,采集客户使用过的产品、有产品标识泄露的图表、视频,由小编整理进行二次宣传。 这些买家秀对新客户来说更可信。 同时,通过一些具有传播特征的话题活动,如“xx挑战”,增加用户参与度,将客户通过WhatsApp反馈的内容展示在产品页面或社交媒体上,甚至可以打造品牌爆炸。 红色的。 场景15:说完开箱视频中的买家秀,就要提到开箱视频了。 一项调查显示,约有62%的人会在购买产品前搜索关键词“拆箱”(Unboxing),以便在下单前更直观地看到产品。 开箱视频的好处: 1. 提供有用的产品信息 2. 引导客户的期望 3. 减少因用户对产品的误解而退货的可能性 4. 提高销量 通过WhatsApp,您可以发送开箱视频或鼓励客户 客户发送在他们的开箱视频中。

  使用环球客外贸开发软件的价值和好处:

  1. 订单轻松上报。 很多大中小型外贸公司的订单审核手续很多,也比较严格,所以费时费力,还得层层上报。 有时候很容易卡在一个点上,导致订单延误。 如果您使用外贸管理系统,随时随地查看订单状态和审核,非常方便。

  2、外贸单据的生成与统计。 外贸企业可以利用外贸软件对各种单据进行生成统计。 人工操作虽然简单、解决速度快,但远不及外贸管理系统的稳定性和安全性。 它会出错,这很重要。

  3. 电子邮件管理和跟踪。 很多外贸公司肯定会遇到这样的问题:公司邮箱不止一个,然后一个客户好几个人都在用邮件跟进。 如果交易的佣金不清楚,而且外贸业务员的报价也会不一样,那么在客户、邮件管理和跟踪方面,一个外贸软件就可以轻松解决。 Facebook 营销,如果你避免帐户禁令!

  1、通过查看*敏*感*词*,可以知道用户是否使用过优惠券,何时使用过。 2. 如果用户长期没有使用优惠券,可以询问为什么不需要,并提供必要的帮助。 场景 3:个性化服务 当用户同意通过 WhatsApp 联系并选择加入时,可以获得以下信息。 1.电话号码 2.国家(通过电话号码中的国家代码)(*当用户设置了WhatsApp用户名时)此外,用户也可以在选择加入时要求填写相应的信息。 比如城市,真实姓名等。基于这些信息,可以提供更友好的交互过程。 比如,招呼客户时,带上客户的名字; 对来自不同国家的人使用不同的语言; 为不同地区的人设置不同的选项; 甚至在与不同的用户交互之前初始化不同的对话过程。 在这个例子中,通过几个简单的问题,你可以立即了解到这个潜在客户年龄在29-39岁之间,喜欢购买休闲服装,每年在衣服上的花费在1000-5000美元之间。 基于这些信息,可以为用户提供更精细的个性化服务。 场景四:产品推荐销售或交叉销售,1v1对话效率最高。 不需要复杂的操作,只需用图表、视频或链接供客户参考。 上面的例子通过将采集到的信息与新的需求相结合,实现了超个性化的用户交互。 场景五:商品筛选不同于上述的个性化商品推荐。 facebook如何自动营销来获取客户? 优采云高效群发

  

  whatsapp官方频道怎么群发消息?跨境王邮箱采集

  Facebook版Globaler的八大优势:

  1、批量采集FB群、同行好友、同行主页、同行*敏*感*词*(无限挖);

  2.批量群发FB群,FB好友Messenger,拦截同行客户(100%准确无误)

  3、双重隔离、防阻塞、防关联技术

  4.支持100+个Facebook账号同时在线发送信息(此技术全国通用)

  5、支持一键智能自动维号(该技术全国独有)

  6、自动过滤重复发送和老客户抗干扰功能。

  7、集成高转化率信息模板,自定义编辑。

  8、操作简单易学,新手也能轻松上手。 客户使用效果感言: 1. Facebook群成员数量无上限,10亿+群链接,快速覆盖千万群。 2、Facebook好友在线数5000,添加速度快。 最快10-15天可以加5000个好友。 3、Facebook首页拦截同行客户,活跃度高,1亿+首页链接,采集速度快。 4. Facebook*敏*感*词*活跃度高,可以快速屏蔽同行的*敏*感*词*,将流量导流到自己的*敏*感*词*。 几百人就可以开播,分流流量。 5. Facebook 版本通常每天收到 30-100 个查询。 6. 使用Globaler Facebook版**,5天内即可发出订单。 7.一年轻松获得1000多个Facebook查询。 Globaler Facebook版跨境王邮箱采集

  深圳市金斗云人工智能*敏*感*词*是一家充满活力的公司,拥有超前的发展理念,先进的管理经验,在发展过程中不断完善,自我要求,不断创新,时刻准备迎接更多的挑战。 其他地区的媒体、广电汇集了众多的人脉和专家,也得到了很多业界的好评。 这些都是不努力和大家一起进步的结果。 这些评价对我们来说是比较好的。 前进的动力也鞭策着我们在未来的日子里保持奋发向上、顽强进取的进取创新精神,努力将公司的发展战略推向一个新的高度。 与您携手迈向更美好的未来,创造更有价值的产品。 我们将以更好的状态、更认真的态度、更充沛的精力去创造、去努力、去努力。 让我们共同努力更好更快的成长!

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线