php curl抓取网页指定内容(PHP手册(再次一句一句以强调)手册真乃圣经)
优采云 发布时间: 2021-09-27 22:05php curl抓取网页指定内容(PHP手册(再次一句一句以强调)手册真乃圣经)
PHP有内置的函数来捕获网页内容,如file()、file()uu获取内容()等等,所有这些都支持URL参数。但这些功能无法实现更复杂的操作
Curl是一个文件传输工具,它使用URL语法在命令行上工作。Curl提供了一个PHP扩展。使用此扩展,可以完全模拟浏览器操作。就像使用浏览器浏览网页一样,您可以设置标题内容、设置cookie数据、发布数据、上载文件、设置代理等。事实上,我们这里讨论的爬行web内容只是一个常见的应用程序
官方网站:
PHP curl扩展:
在windows下添加此扩展非常简单,只需加载PHP_Curl.dll即可。删除curl.dll前面的php.ini文件扩展名=php_uu分号,将curl.dll复制到php扩展目录或C:\windows\system32目录中,然后重新启动web服务器。php的zip包中提供了php_Curl.dll
在Linux下,首先需要安装curl。一种方法是将其编译成PHP,并在编译和配置时添加--with curl[=dir]。另一种方法是将其编译成PHP模块并加载。curl模块的编译方法与其他PHP模块的编译方法相同。以下是基本命令:
CD/path/to/PHP/source进入PHP源目录
CD ext/curl输入curl模块的源目录
/Usr/local/PHP/bin/phpize生成编译配置文件
./configure--with-php-config=/usr/local/php/bin/php-config
制造
安装
编译完成后,生成curl.so,修改php.ini,加载模块:
extension=“/path/to/extension/curl.so”
测试是否加载了curl扩展名并创建一个新的PHP文件:
抓取网页的示例:
curl_uusetopt()可以设置许多选项。有关更多选项,请参阅PHP手册
有关更多函数及其用法,请参阅PHP手册(另一个强调PHP手册是圣经的废话)
)