抓取网页数据 php(爬虫对php的特殊支持（生成的dom），易上手)

优采云发布时间: 2021-09-22 14:07

　　抓取网页数据php代码分析相当复杂，我一般都只关注最核心的app数据。爬虫需要解决的php问题是：tp对php的特殊支持（生成的dom），如果其他系统不熟，另外就是一个字符串解析问题，这个使用xpathtxtjsonlist等另外我一直也没找到一个很好的完美且速度能大幅度提升的网络爬虫方案，直到我看到这个~learnpythonthehardway!withpython,minecraft:venom!获取单词列表文章列表也是同样的道理-started-with-python-the-hard-way-with-python-venom。

　　针对python1.x

　　python建议python3，

　　题主还没明白python的几个特性：

　　1）按照brainfuck语法，

　　2）tf、pytorch的分布式计算的底层很大程度上是用了python实现

　　3）python的异步io可以用jit技术加速不少步骤

　　谢邀。肯定是python啊。但是，learnpythonthehardway!是需要c++库的，所以要学好c++，推荐learnpythonthehardway!(github)一开始可以用python写一些简单的东西，然后用c+++模拟运行测试，但是只是模拟运行。后面对于python有了更深的研究，那么可以拿来用。

　　我看了一下，我觉得其实挺像的。python的语法，易上手，合理性，模块化等等都是比较优秀的。在一开始写爬虫的时候，采集效率一般是很重要的，如果采集效率很差，那么随之而来的是时间的流逝和cpu资源的消耗，和功耗，gpu消耗等等，所以说，学会怎么写爬虫，是一个可持续的积累，最后可能写出来的东西才会比较好。

　　而对于这些爬虫能做什么，不会太专业，上手这些爬虫和你开始写写网站是一样的，都是你的知识储备。而对于c++，基本上是c++程序员加持的，他们写的网站，各种服务器，客户端，那么就需要多学点。

0

2021-09-22

抓取网页数据 php

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

抓取网页数据 php(爬虫对php的特殊支持（生成的dom），易上手)

0 个评论

发起人