c 抓取网页数据(C#.Net基于正则表达式抓取百度百家文章列表的方法(图))

优采云 发布时间: 2021-10-07 02:06

  c 抓取网页数据(C#.Net基于正则表达式抓取百度百家文章列表的方法(图))

  本文文章主要介绍了C#.Net基于正则表达式抓取百度百家文章列表的方法,分析C#获取百度百家文章的内容及使用示例形式的正则表达式。表情匹配标题、内容、地址等相关操作技巧,有需要的朋友可以参考

  本文介绍了C#.Net基于正则表达式抓取百度百家文章列表的方法。分享给大家,供大家参考,如下:

  下班后,我学习了正则表达式。由于实践是检验真理的唯一标准,我写了一个使用正则表达式捕获百度百家文章的例子。具体过程请看下面的源码:

  一、获取百度百家网页内容

   public List GetUrl() { try { string url = "http://baijia.baidu.com/"; WebRequest webRequest = WebRequest.Create(url); WebResponse webResponse = webRequest.GetResponse(); StreamReader reader = new StreamReader(webResponse.GetResponseStream()); string result = reader.ReadToEnd(); reader.Close(); webResponse.Close(); return AnalysisHtml(result); } catch (Exception ex) { throw ex; } }

  二、通过正则表达式过滤

<p> public List AnalysisHtml(string htmlContent) { List list = new List(); string strPattern = "(?[^

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线