网页信息抓取软件(没显示完整地址是你截图选中的那条(图) )

优采云 发布时间: 2021-10-19 07:14

  网页信息抓取软件(没显示完整地址是你截图选中的那条(图)

)

  问题

  %E8%99%9A%E6%8B%9F%E5%8C%96&bidType=0&bidWay=0&region=0

  请看这个网站,翻页是通过ajax,界面没有刷新。

  

  

  我做了一个爬虫,想爬到上面的内容。根据网上教程,我发送了一个xmlhttprequest:

  放入数据和标题:

  #-*- coding: UTF-8 -*-

import sys

import time

from HTMLParser import HTMLParser

import requests

import random

from bs4 import BeautifulSoup

reload(sys)

sys.setdefaultencoding('utf8')

def get_info(url):

info_list=[]

headers={"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.85 Safari/537.36 QQBrowser/3.9.3943.400"

'X-Requested-With': 'XMLHttpRequest'}

data={

"searchKey":"虚拟化",

"bidType":"0",

"bidWay":"0",

"region":"0",

"solrType":"0",

"frontMobanType":"1",

"pageNum":"2",#应该就是通过传输这个pageNum给服务器实现翻页

"pageCount":"30"

}

try:

content = requests.post(url,data=data,headers=headers).content#就是这里

#t = session.post(url,data,headers)

print content#无法print出内容,说是HTTP Status 405 - Request method 'POST' not supported

except Exception,e:

print e

return

get_info('http://www.zjzfcg.gov.cn/cggg?pageNum=1&pageCount=30&searchKey=%E5%AD%98%E5%82%A8&bidType=0&bidWay=0&region=0')

  请分析一波,有什么问题吗?

  解决方案

  很明显,邮寄地址是错误的,真实地址就是你在截图中选择的那个。

  (回复中无法插入图片,请在此处添加)

  浏览器未显示完整网址信息,需自行查看完整地址

  

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线