php用正则表达抓取网页中文章( C#Winform应用程序获取网页源文件的方法分析介绍(图) )

优采云 发布时间: 2022-02-04 16:05

  php用正则表达抓取网页中文章(

C#Winform应用程序获取网页源文件的方法分析介绍(图)

)

  使用C# Winform应用程序获取网页源文件的解决方案

  更新时间:2013-05-20 11:20:11 投稿:景贤

  本文文章对使用C# Winform应用程序获取网页源文件的方法进行了详细的分析和介绍,有需要的朋友可以参考以下

  在 C# Winform 应用程序中,要获取网页的源文件,可以使用以下方法:

  首先引入命名空间

  使用 System.IO;

  使用 System.Net;

  

WebClient MyWebClient = new WebClient();

MyWebClient.Credentials = CredentialCache.DefaultCredentials;//获取或设置用于向Internet资源的请求进行身份验证的网络凭据

Byte[] pageData = MyWebClient.DownloadData("http://www.baidu.com");

//string pageHtml = Encoding.Default.GetString(pageData);

FileStream file = new FileStream("C:\\test.html", FileMode.Create);

file.Write(pageData, 0, pageData.Length);

  附上,c#代码示例,获取网页源代码。

  C#可以通过三种方式获取指定网页的HTML源代码:WebClient WebRequest HttpWebRequest。

  当然,您也可以使用 webBrowse。有兴趣的朋友可以自己研究一下。

  1、WebClient方法

  

private string GetWebClient(string url)

{

string strHTML = "";

WebClient myWebClient = new WebClient();

Stream myStream = myWebClient.OpenRead(url);

StreamReader sr = new StreamReader(myStream, System.Text.Encoding.GetEncoding("utf-8"));

strHTML = sr.ReadToEnd();

myStream.Close();

return strHTML;

}

  2、WebRequest方法

  

private string GetWebRequest(string url)

{

Uri uri = new Uri(url);

WebRequest myReq = WebRequest.Create(uri);

WebResponse result = myReq.GetResponse();

Stream receviceStream = result.GetResponseStream();

StreamReader readerOfStream = new StreamReader(receviceStream, System.Text.Encoding.GetEncoding("utf-8"));

string strHTML = readerOfStream.ReadToEnd();

readerOfStream.Close();

receviceStream.Close();

result.Close();

return strHTML;

}

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线