php 循环抓取网页内容(用boost吧可以试一下用json的api？get或者post是什么直接访问:回显所有（大部分）客户端)

优采云发布时间: 2022-02-11 16:09

　　php循环抓取网页内容代码不是很多,数据量也不是特别大,那么可以使用http响应头来接收,在php代码中curl_setopt(curlopt_response_type,'message',errno);curlopt_response_type是一个头文件,curlopt调用了它,errno为undefined所以我们直接从undefined来抓取数据再进行解析。

　　当然可以啊，

　　php的get(request.c_session,stringheader)是自动请求所有的协议。你可以自己自定义一些协议，然后如下操作：post一个request//request.custompostenv:='location...';//request.custom:location...('forward','location...')sendredirect(request,'post',stringheader)//request.custom:sendredirect('post',stringheader)post给所有（不包括location...）的地址('forward','post')sendredirect(request,'post',stringheader)。

　　用boost吧

　　可以试一下用json的api？xml/pdf应该也是可以的，

　　get或者post是什么

　　直接访问:443，回显所有（大部分）客户端，

　　您可以试一下用filezilla来同步抓取，这个我们在部署filezilla之前已经部署成功了30万条，数据量也不算很大。如果您愿意的话可以试一下其他的云服务比如openvz，阿里云等等。如果实在想有点收获，可以用scrapy或者tornado这些web框架实现抓取，这样就是在于你用什么了，requests比较庞大吧，相对于filezilla来说scrapy或者tornado比较小了。

0

2022-02-11

php 循环抓取网页内容

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

php 循环抓取网页内容(用boost吧可以试一下用json的api？get或者post是什么直接访问:回显所有（大部分）客户端)

0 个评论

发起人

AI时代内容工厂

php 循环抓取网页内容(用boost吧可以试一下用json的api？get或者post是什么直接访问:回显所有（大部分）客户端)

0 个评论

发起人

相关问题