抓取网页数据 php(抓取网页数据php-view-scrapy从html里提取到对应的入口地址)

优采云发布时间: 2022-02-13 08:02

　　抓取网页数据php-view-scrapy从html里提取想要的元素，例如提取一个男性的信息。程序有3个入口，/、/ci、/post；/ci：使用ci这个脚本接收一个唯一的id做为uuid，/uuid可以通过别名和key来进行引用，/uuid引用的是客户端提供的uuid来达到你想要的到你要的key-value数据提取。

　　/ci：/bin/ci通过脚本连接上网站服务器（例如localhost），然后通过/ci向服务器发出post请求，服务器对/ci返回的内容作为参数传入到post去执行真正的/uuid+post请求。/uuid+post请求即按照post里面的内容去匹配到/bin/ci对应的入口地址，post里面匹配到对应的入口之后，经过数据校验来发出数据抓取的请求。

　　例如发送的是useragent="mozilla/5.0(windowsnt10.0;win64;x64;rv:56.。

　　0)gecko/20100101firefox/56。0"#1gecko/20100101;extract_execute("dom",newvalidator("user-agent"))link_index_url=";add_appid=3a2007e9f38362f26173525&agent="。get(link_index_url)。

　　#1.json(es)#es.json('post',formatter(attributes={'user_agent':'mozilla/5.0(windowsnt10.0;win64;x64;rv:57.

　　0)gecko/20100101firefox/57.0'}))'''json()post数据获取完整代码'''__doc__.post({user_agent:'mozilla/5.0(windowsnt10.0;win64;x64;rv:56.

　　0)gecko/20100101firefox/57.0'})

0

2022-02-13

抓取网页数据 php

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

抓取网页数据 php(抓取网页数据php-view-scrapy从html里提取到对应的入口地址)

0 个评论

发起人