php用正则表达抓取网页中文章(import,requests,,日记学习内容(1)())
优采云 发布时间: 2021-11-27 11:09php用正则表达抓取网页中文章(import,requests,,日记学习内容(1)())
首页>博客文章python爬虫日记(一)
withpy2021-11-05
学习内容简介(1)正则表达式:re-------用于提取有用的文本信息--------常用的是(.*?), (*? .jpg), (*?.mp3)--------常用命令pile(), re.findall() (2)requests-------- A通过requests.get/post(url,headers)获取网页信息或文件的简单例子:importre"
标签:--------python爬虫编译器ehttpsimportrequests日记
学习内容
(1)正则表达式:re
-------用于提取有用的文本信息
--------常用的是(.*?), (*?.jpg), (*?.mp3)
--------常用命令pile()、re.findall()
(2)请求请求
--------通过requests.get/post(url,headers)获取网页信息或文件
简单例子:
<p>import re
import requests
i=0
for x in range(100):
url = 'http://acm.zzuli.edu.cn/ranklist.php?start='+str(i)
findlink = re.compile(r"user=.*?</a> (.*?)