连干10天，完成这款seo工具集合

优采云发布时间: 2022-07-22 14:04

　　连干10天，完成这款seo工具集合

　　搜狗快照反馈，原理一样，同样是拿到接口就可以，不过搜狗快照反馈是不需要登录的，只需要验证一下验证码就可以。

　　同样在代码里，将请求参数进行复原。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

def fankui_sougou(self,url,email): # while True: multipart_encoder = MultipartEncoder( fields = { 'KuaizhaoUpdate[webAdr][]':url, 'KuaizhaoUpdate[contact]':email, 'webContactWayTypeForm2':'邮箱', 'jsVcodeForm2':self.code } ) self.headers['Content-Type'] = multipart_encoder.content_type self.headers['accept'] = 'application/json' resp = self.session.post(url=self.fankui_url,data=multipart_encoder,headers=self.headers).json() return resp

　　三、百度关键词排名查询

　　百度关键词排名查询，查询原理主要是解析百度页面，获取目标网站的排名即可，查询过程中，偶尔会出现不稳定的情况，这个需要配合请求代理使用。只要少量查询是没有问题的。

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33

def spider_html(self, url): proxy = 't15033843606481:ucxt8q6k@tps543.kdlapi.com:15818' while True: try: proxies = { 'http': 'http://' + proxy, 'https': 'http://' + proxy } self.session.get(url=self.m_base_url, headers=headers, proxies=proxies) break except: continue resp = self.session.get(url=url, headers=headers, verify=False) resp.encoding = resp.apparent_encoding # print(resp.text) print(resp.status_code) while 'wappass' in resp.url: print('出现验证码了', resp.url) rand_ip = self.rand_ip() url = url.replace(urlparse(url).netloc, rand_ip) try: resp = self.session.get(url=url, headers=headers, proxies=proxies, verify=False) except: continue else: if not 'wappass' in resp.url: return resp.text

　　四、百度主动推送

　　百度主动推送还是比较简单的，只要在百度站长平台拿到接口地址就可以模拟post请求了。

　　在代码里，请求部分，可以这么操作

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

def badiu_tuisong(token,site,data): url = f'http://data.zz.baidu.com/urls?site={site}&token={token}' # data = '\n'.join(open('urls.txt','r').read().splitlines()) headers = { 'Content-Type': 'text/plain', } result = requests.post(url=url,data=data,headers=headers).json() # request = urllib.request.Request(url=url,data=bytes(data,encoding='utf-8'),headers=headers) # resp = urllib.request.urlopen(request) # result = eval(resp.read().decode()) # result.update({'url':site}) try: if result['success']: return result else: del result['success'] del result['not_same_site'] result.update({'fail':0}) return result except: return result

　　五、搜狗关键词排名

　　搜狗关键词排名原理同样的解析页面，通过页面拿到目标网站的排名

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

def spider_html(self,url): self.session.get(url=self.vsogou_url) try: rand_headers = Headers(headers=True).generate() headers = { 'User-Agent':rand_headers['User-Agent'], } resp = self.session.get(url=url,headers=headers) resp.encoding = resp.apparent_encoding # print(resp.text) return resp.text except Exception as e: print(e) def parse_html(self,html): e_obj = etree.HTML(html) divs = e_obj.xpath("//div[@id='main']//div[@class='vrwrap']") # print(divs) for index,div in enumerate(divs): i = div.xpath("./div[@class='citeurl']/i") if i: yu_name = div.xpath("./div[@class='citeurl']/span[2]/text() | .//div[contains(@class,'citeurl')]/span[1]/text()") # print(yu_name) else: yu_name = div.xpath("./div[@class='citeurl']/span[1]/text() | .//div[contains(@class,'citeurl')]/span[1]/text()") # print(yu_name) if yu_name: if self.web_name in yu_name[0]: ranking = index + 1 if index == 0 else index return ranking

　　六、搜狗移动关键词排名

　　搜狗移动关键词排名解析的是搜狗移动端的页面，然后获取排名信息即可，不过代码解析部分和pc端的不一样

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30

def spider_html(self, url): self.session.get(url=self.vsogou_url) try: rand_headers = Headers(headers=True).generate() headers = { 'User-Agent': rand_headers['User-Agent'], } resp = self.session.get(url=url, headers=headers) resp.encoding = resp.apparent_encoding # print(resp.text) return resp.text except Exception as e: print(e) def parse_html(self, html): # print(html) soup = BeautifulSoup(html, 'lxml') divs = soup.select("body div.vrResult") for div in divs: if not div: continue item = div.select(".citeurl span") if not item: continue try: item = item[0].get_text() except: item = item[1].get_text() if self.web_name in item: ranking = re.sub(r'.*_', '', div.attrs['id']) return ranking

　　七、百度下拉词获取

　　百度下拉词获取调用的下拉词的接口，

　　在代码里，不断测试获取有用的参数，最终在代码里只需要两个参数就可以了

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

def getXialaci(self,keyword): url = 'https://www.baidu.com/sugrec' params = { 'prod': 'pc', 'wd': keyword, } try: res = requests.get(url,params=params,timeout=5).json() except: pass # print(json.dumps(res,indent=4,ensure_ascii=False)) else: if res.get('g',''): keywords = [keyword['q'] for keyword in res['g']] print(keywords) return keywords

　　下面视频介绍简单了解一下：

　　软件的总体原理就这样了，有其他疑问的地方或者需要使用这款集合软件，另外后面会继续新增功能，有需要的朋友可以定制，可以私信我！vx:dan_moln

0

2022-07-22

百度seo分析工具

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

连干10天，完成这款seo工具集合

0 个评论

发起人