汇总:Python关键词数据采集案例,5118查询网站关键词数据采集
优采云 发布时间: 2022-12-26 11:27汇总:Python关键词数据采集案例,5118查询网站关键词数据采集
对于seoer来说,关注网站的关键词数据,关键词的排名,流量的来源,同行的网站数据是非常重要的,所以使用seo查询工具也是非常有必要的。 比较知名的有爱站龙工具、站长工具和5118。
当然现在5118更全面,应用更广泛!
在数据和功能上,5118很强大!
可以的话就付钱!
5118的抗爬还是很不错的!
需要登录采集,发现5118更新了一次!
比如登录账号需要经过滑块验证码的反爬限制,关键词索引等数据都以图片加密的形式展示。 这个人渣破解不了,我也怕。 .
不过有些数据还是可以参考的! 所以,让 python 起来!
查一个设计网站,设计成瘾的关键词
抓取网址:
如果您不是付费会员,您只能查看前100页的数据!
很多数据都是反爬限制,有点可惜!
虽然5118会员登录有滑块验证码,但是cookies登录还是非常好用的!
我们手动添加 cookie 以登录以采集所需数据。
几个关键点:
1. 添加协议头:
headers={
'Accept': 'application/json, text/javascript, */*; q=0.01',
'Accept-Encoding': 'gzip, deflate, br',
'Accept-Language': 'zh-CN,zh;q=0.9',
'Connection': 'keep-alive',
'Content-Length': '0',
'Cookie': Cookies,
'Host': 'www.5118.com',
'Origin': 'https://www.5118.com',
'Referer': 'https://www.5118.com/',
'User-Agent': ua,
'X-Requested-With': 'XMLHttpRequest',
}
添加 ua 和 cookes 自己!
当然这是一个完整的协议头,有些可以删掉,大家可以自己试试!
2.zip函数的使用和格式化数据的处理之前有分享过!
for keyword,rank,title,link,index_link in zip(keywords,ranks,titles,links,index_links):
data=[
keyword,
rank.xpath('string(.)').strip().replace(' ','').replace('rn','-'),
self.get_change(rank),
title,
unquote(link.split('target=')[-1]),
'https:{}'.format(index_link),
]
print(data)
3.排名波动的处理
通过源码查询可以知道,绿色表示排名上升,红色表示排名下降。 这里有一个判断就搞定了!
#判断排名是否提升
def get_change(self,rank):
rank=etree.tostring(rank).decode('utf-8')
if "red" in str(rank):
change="下降"
elif "green" in str(rank):
change = "提升"
else:
change = "不变"
return change
4.将关键词数据写入csv
写了一个案例,发现了两个参考案例
import csv
#关键词数据写入csv
def write_keywords(self):
path='{}_keywords.csv'.format(self.file_name)
csvfile = open(path, 'a+')
for keyword in self.keyword_datas:
csvfile.write('%sn' % keyword)
print("5118关键词搜索数据写入csv成功!")
#参考一
def write_csv(self):
path = "aa.csv"
with open(path, 'a+') as f:
csv_write = csv.writer(f)
data_row = ["1", "2"]
csv_write.writerow(data_row)
# 参考二
def wcsv(self):
<p>
csvfile = open('csvtest.csv', 'w')
writer = csv.writer(csvfile)
writer.writerow(['keywords'])
data = [
('1', 'http://www.xiaoheiseo.com/', '小黑'),
('2', 'http://www.baidu.com/', '百度'),
('3', 'http://www.jd.com/', '京东')
]
writer.writerows(data)
csvfile.close()</p>
5、查询网站相关关键词数据,写入excel表格
使用第三方库,xlsxwriter
#数据写入excle表格
def write_to_xlsx(self):
workbook = xlsxwriter.Workbook('{}_search_results.xlsx'.format(self.file_name)) # 创建一个Excel文件
worksheet = workbook.add_worksheet(self.file_name)
title = ['关键词', '排名', '排名波动', '网页标题', '网页链接', '长尾词链接'] # 表格title
worksheet.write_row('A1', title)
for index, data in enumerate(self.data_lists):
num0 = str(index + 2)
row = 'A' + num0
worksheet.write_row(row, data)
workbook.close()
print("5118搜索数据写入excel成功!")
由于页码也是js生成的,所以没有找到,所以自己输入页码!
输入查询网站的URL格式为:抓取后数据存储文件使用主域名!
附上完整代码:
#5118网站关键词数据获取
import requests
from lxml import etree
from urllib.parse import unquote
import xlsxwriter
import time
import csv
class C5118(object):
def __init__(self,url,nums):
self.keyword_datas=[]
self.data_lists=[]
self.index_links_hrefs=[]
self.headers={
'Accept': 'application/json, text/javascript, */*; q=0.01',
'Accept-Encoding': 'gzip, deflate, br',
'Accept-Language': 'zh-CN,zh;q=0.9',
'Connection': 'keep-alive',
'Content-Length': '0',
'Cookie': Cookies,
'Host': 'www.5118.com',
'Origin': 'https://www.5118.com',
'Referer': 'https://www.5118.com/',
'User-Agent': UA,
'X-Requested-With': 'XMLHttpRequest',
}
self.post_url=url
self.file_name=url.split('.')[1]
self.pagenums=nums
#判断排名是否提升
def get_change(self,rank):
rank=etree.tostring(rank).decode('utf-8')
if "red" in str(rank):
change="下降"
elif "green" in str(rank):
change = "提升"
else:
change = "不变"
return change
#获取数据
def get_data(self,pagenum):
url="https://www.5118.com/seo/baidupc"
params={
'isPager': 'true',
'viewtype': '2',
'days': '90',
<p>
'url': self.post_url,
'orderField': 'Rank',
'orderDirection': 'asc',
'pageIndex': pagenum, #页码
'catalogName': '',
}
response=requests.post(url,params=params,headers=self.headers)
time.sleep(1)
print(response.status_code)
doc=etree.HTML(response.content.decode('utf-8'))
keywords= doc.xpath('//tr[@class="list-row"]/td[1]/a/text()') #关键词
print(keywords)
self.keyword_datas.extend(keywords)
ranks = doc.xpath('//tr[@class="list-row"]/td[2]/a') #排名
titles = doc.xpath('//tr[@class="list-row"]/td[5]/a/text()') #网页标题
links=doc.xpath('//tr[@class="list-row"]/td[5]/a/@href') #网页链接
index_links=doc.xpath('//tr[@class="list-row"]/td[7]/a/@href') #长尾词数量链接
self.index_links_hrefs.extend(index_links)
for keyword,rank,title,link,index_link in zip(keywords,ranks,titles,links,index_links):
data=[
keyword,
rank.xpath('string(.)').strip().replace(' ','').replace('rn','-'),
self.get_change(rank),
title,
unquote(link.split('target=')[-1]),
'https:{}'.format(index_link),
]
print(data)
self.data_lists.append(data)
time.sleep(4)
return self.data_lists
#关键词数据写入csv
def write_keywords(self):
path='{}_keywords.csv'.format(self.file_name)
csvfile = open(path, 'a+')
for keyword in self.keyword_datas:
csvfile.write('%sn' % keyword)
print("5118关键词搜索数据写入csv成功!")
#数据写入excle表格
def write_to_xlsx(self):
workbook = xlsxwriter.Workbook('{}_search_results.xlsx'.format(self.file_name)) # 创建一个Excel文件
worksheet = workbook.add_worksheet(self.file_name)
title = ['关键词', '排名', '排名波动', '网页标题', '网页链接', '长尾词链接'] # 表格title
worksheet.write_row('A1', title)
for index, data in enumerate(self.data_lists):
num0 = str(index + 2)
row = 'A' + num0
worksheet.write_row(row, data)
workbook.close()
print("5118搜索数据写入excel成功!")
def main(self):
for i in range(1,self.pagenums+1):
print(f'>>> 正在采集第{i}页关键词数据...')
self.get_data(i)
print("数据采集完成!")
self.write_keywords()
self.write_to_xlsx()
if __name__=="__main__":
url = "www.shejipi.com"
nums=100
spider=C5118(url,nums)
spider.main()</p>
采集效果:
设计迷网站关键词相关数据:shejipi_search_results..xlsx
设计瘾网站关键词数据:shejipi_keywords.csv
汇总:跨境王邮箱采集
想要做好海外推广,学习Facebook营销是每个广告主的必修课。 接下来,我将从三个方面详细阐述Facebook营销的具体操作: 首先,分享一些Facebook营销技巧:
1. 2/8 规则。这意味着在规划您的 Facebook 页面内容时,您必须确保只有
20%的内容是“硬卖”,剩下的80%应该是其他对用户有趣、有教育意义、有价值的非营销内容。 80%的非营销内容的作用是吸引用户,覆盖20%的营销内容,所以营销信息不宜过多。 2. 在紧要关头松开。 一般来说,比较好的时间是晚上12:00到1:00。 在这段时间里,会有更多人看到你并与你互动。 但具体发布时间建议根据您的目标用户的活跃时间来确定。
3. 更多@fans。 茫茫人海中的一个@,可以拉近粉丝与你的距离。
4.即时回复。 现在很多消费者更喜欢直接通过Facebook与品牌沟通,人们往往更期待即时回复而不是自动回复。及时回复更有利于提高Facebook排名和赢得粉丝忠诚度
5. 共享用户生成的内容 (UGC)。 超过 90% 的消费者在决定购买产品之前会参考 UGC。 另外,将UGC融入到营销内容中,也能让你的营销更有趣、更可信,所以平时应该多采集一些用户生成的内容。
6.发布图文。 图文是Facebook上点赞数和转发数都很高的文章类型。 insgram采集,群发获客!跨境王邮箱采集
跨境获客系统
全网推广是每个营销人员都比较喜欢的一种方式,但是现在的市场竞争非常激烈,每一个推广代理都能在这方面脱颖而出,当然也会有自己独特的引流方式。 什么是全网营销获客的话题也越来越受到关注。 其实在竞争的过程中,还是实事求是比较好。 然后,您将掌握以下要点,以吸引全球访问者的流量。
1. 对粉丝的准确度有了更大的把握。 只有锁定了粉丝群进行投放,我们才会清楚地了解这些粉丝的需求和痛点。 先分析总结,再进行全网营销获取客户,会有更好的效果。 粉丝锁定越精准,能带来的变现机会就越多。
2. 真人出镜成为环球人内容的重要组成部分。 对于广大用户群体来说,对彩色隐形眼镜的信任度还不够高,市场良莠不齐。 因此,如果你想知道什么是通过网络营销获客。 必须是真人出场,通过自己的体验来使用效果,自然会得到粉丝的好评,引流效果也会越来越好。 在这个过程中,需要把握真人外表的尺度。
3、效果比较与大力促销活动相结合。 这时候如果粉丝观察你的Globalist一段时间后,会更加关注之前使用的效果。 然后,用效果图对比上传,再推出促销活动,这时候营销效果可能会更好。
小漫CRM可以自动发消息到whatsapp识别男女和年龄吗?
客户需要做的就是直接在 WhatsApp 对话框中检索他们的想法。 想象一下,如果你是客户,你只需要在你习惯的界面中轻松还原几句话,甚至发送一段语音。 您愿意给商店一些反馈吗? 还可以根据用户评论,通过智能算法自动检测内容中是否存在负面信息,立即提升客户优先级,提升满意度。 场景14:Buyer Show现在是一个品牌,靠传统的单向广告,性价比更低。 通过组织活动,采集客户使用过的产品、有产品标识泄露的图表、视频,由小编整理进行二次宣传。 这些买家秀对新客户来说更可信。 同时,通过一些具有传播特征的话题活动,如“xx挑战”,增加用户参与度,将客户通过WhatsApp反馈的内容展示在产品页面或社交媒体上,甚至可以打造品牌爆炸。 红色的。 场景15:说完开箱视频中的买家秀,就要提到开箱视频了。 一项调查显示,约有62%的人会在购买产品前搜索关键词“拆箱”(Unboxing),以便在下单前更直观地看到产品。 开箱视频的好处: 1. 提供有用的产品信息 2. 引导客户的期望 3. 减少因用户对产品的误解而退货的可能性 4. 提高销量 通过WhatsApp,您可以发送开箱视频或鼓励客户 客户发送在他们的开箱视频中。
使用环球客外贸开发软件的价值和好处:
1. 订单轻松上报。 很多大中小型外贸公司的订单审核手续很多,也比较严格,所以费时费力,还得层层上报。 有时候很容易卡在一个点上,导致订单延误。 如果您使用外贸管理系统,随时随地查看订单状态和审核,非常方便。
2、外贸单据的生成与统计。 外贸企业可以利用外贸软件对各种单据进行生成统计。 人工操作虽然简单、解决速度快,但远不及外贸管理系统的稳定性和安全性。 它会出错,这很重要。
3. 电子邮件管理和跟踪。 很多外贸公司肯定会遇到这样的问题:公司邮箱不止一个,然后一个客户好几个人都在用邮件跟进。 如果交易的佣金不清楚,而且外贸业务员的报价也会不一样,那么在客户、邮件管理和跟踪方面,一个外贸软件就可以轻松解决。 Facebook 营销,如果你避免帐户禁令!
1、通过查看*敏*感*词*,可以知道用户是否使用过优惠券,何时使用过。 2. 如果用户长期没有使用优惠券,可以询问为什么不需要,并提供必要的帮助。 场景 3:个性化服务 当用户同意通过 WhatsApp 联系并选择加入时,可以获得以下信息。 1.电话号码 2.国家(通过电话号码中的国家代码)(*当用户设置了WhatsApp用户名时)此外,用户也可以在选择加入时要求填写相应的信息。 比如城市,真实姓名等。基于这些信息,可以提供更友好的交互过程。 比如,招呼客户时,带上客户的名字; 对来自不同国家的人使用不同的语言; 为不同地区的人设置不同的选项; 甚至在与不同的用户交互之前初始化不同的对话过程。 在这个例子中,通过几个简单的问题,你可以立即了解到这个潜在客户年龄在29-39岁之间,喜欢购买休闲服装,每年在衣服上的花费在1000-5000美元之间。 基于这些信息,可以为用户提供更精细的个性化服务。 场景四:产品推荐销售或交叉销售,1v1对话效率最高。 不需要复杂的操作,只需用图表、视频或链接供客户参考。 上面的例子通过将采集到的信息与新的需求相结合,实现了超个性化的用户交互。 场景五:商品筛选不同于上述的个性化商品推荐。 facebook如何自动营销来获取客户? 优采云高效群发
whatsapp官方频道怎么群发消息?跨境王邮箱采集
Facebook版Globaler的八大优势:
1、批量采集FB群、同行好友、同行主页、同行*敏*感*词*(无限挖);
2.批量群发FB群,FB好友Messenger,拦截同行客户(100%准确无误)
3、双重隔离、防阻塞、防关联技术
4.支持100+个Facebook账号同时在线发送信息(此技术全国通用)
5、支持一键智能自动维号(该技术全国独有)
6、自动过滤重复发送和老客户抗干扰功能。
7、集成高转化率信息模板,自定义编辑。
8、操作简单易学,新手也能轻松上手。 客户使用效果感言: 1. Facebook群成员数量无上限,10亿+群链接,快速覆盖千万群。 2、Facebook好友在线数5000,添加速度快。 最快10-15天可以加5000个好友。 3、Facebook首页拦截同行客户,活跃度高,1亿+首页链接,采集速度快。 4. Facebook*敏*感*词*活跃度高,可以快速屏蔽同行的*敏*感*词*,将流量导流到自己的*敏*感*词*。 几百人就可以开播,分流流量。 5. Facebook 版本通常每天收到 30-100 个查询。 6. 使用Globaler Facebook版**,5天内即可发出订单。 7.一年轻松获得1000多个Facebook查询。 Globaler Facebook版跨境王邮箱采集
深圳市金斗云人工智能*敏*感*词*是一家充满活力的公司,拥有超前的发展理念,先进的管理经验,在发展过程中不断完善,自我要求,不断创新,时刻准备迎接更多的挑战。 其他地区的媒体、广电汇集了众多的人脉和专家,也得到了很多业界的好评。 这些都是不努力和大家一起进步的结果。 这些评价对我们来说是比较好的。 前进的动力也鞭策着我们在未来的日子里保持奋发向上、顽强进取的进取创新精神,努力将公司的发展战略推向一个新的高度。 与您携手迈向更美好的未来,创造更有价值的产品。 我们将以更好的状态、更认真的态度、更充沛的精力去创造、去努力、去努力。 让我们共同努力更好更快的成长!