抓取网页数据 php(抓取网页数据php-view-scrapy从html里提取到对应的入口地址)

优采云 发布时间: 2022-02-13 08:02

  抓取网页数据 php(抓取网页数据php-view-scrapy从html里提取到对应的入口地址)

  抓取网页数据php-view-scrapy从html里提取想要的元素,例如提取一个男性的信息。程序有3个入口,/、/ci、/post;/ci:使用ci这个脚本接收一个唯一的id做为uuid,/uuid可以通过别名和key来进行引用,/uuid引用的是客户端提供的uuid来达到你想要的到你要的key-value数据提取。

  /ci:/bin/ci通过脚本连接上网站服务器(例如localhost),然后通过/ci向服务器发出post请求,服务器对/ci返回的内容作为参数传入到post去执行真正的/uuid+post请求。/uuid+post请求即按照post里面的内容去匹配到/bin/ci对应的入口地址,post里面匹配到对应的入口之后,经过数据校验来发出数据抓取的请求。

  例如发送的是useragent="mozilla/5.0(windowsnt10.0;win64;x64;rv:56.。

  0)gecko/20100101firefox/56。0"#1gecko/20100101;extract_execute("dom",newvalidator("user-agent"))link_index_url=";add_appid=3a2007e9f38362f26173525&agent="。get(link_index_url)。

  #1.json(es)#es.json('post',formatter(attributes={'user_agent':'mozilla/5.0(windowsnt10.0;win64;x64;rv:57.

  0)gecko/20100101firefox/57.0'}))'''json()post数据获取完整代码'''__doc__.post({user_agent:'mozilla/5.0(windowsnt10.0;win64;x64;rv:56.

  0)gecko/20100101firefox/57.0'})

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线