谷歌抓取网页视频教程(前一个专题介绍:Web浏览器的介绍及工作原理分析)

优采云 发布时间: 2021-10-14 10:18

  谷歌抓取网页视频教程(前一个专题介绍:Web浏览器的介绍及工作原理分析)

  前言:

  上一主题介绍了自定义的Web服务器,但是对Web服务器的请求是本主题介绍的Web浏览器。本专题通过简单的自定义一个网页浏览器简单介绍浏览器的工作原理和帮助 一些初学者揭开了浏览器的神秘面纱(以前这些应用总觉得很深奥,没想到可以自定义一个浏览器我)。下面不再罗嗦,进入正题。

  一、网页浏览器介绍

  Web浏览器是指一种可以显示Web服务器或本地文件系统中的Html文件内容,并允许用户与这些文件进行交互的软件。对服务器返回的超文本信息和各种媒体、图片进行解释和显示。

  浏览器主要通过Http协议与服务器交互,获取网页。目前主流浏览器包括:IE、Google Chrome(谷歌浏览器)、Mozilla Firefox(火狐)、Opera浏览器、世界之窗、360安全浏览器等。

  网络浏览器的组成

  一般而言,Web 浏览器由控制器和解释器组成。控制器负责解释鼠标点击和键盘输入,并调用其他组件来执行用户指定的操作。例如,当用户输入 URL 或点击超链接时,控制器接收并分析命令,调用 HTML 解释器来解释页面,并将解释的结果显示在用户的浏览器上。

  解释器对浏览器非常重要。解释器,即解释引擎,负责解释网页的语法(如HTML、Javascript)并显示网页。解释器决定浏览器如何显示页面。它是浏览器最重要的部分。内核最重要的部分,所以一般我们所指的浏览器内核指的是浏览器的解释器。

  不同的浏览器产品可能使用相同的内核。有四种常见的浏览器内核:Trident、Gecko、Presto 和 Webkit。它们与主流浏览器的关系如下:

  核心

  浏览器产品

  三叉戟

  IE、傲游(Maxthon)、世界之窗、腾讯TT、搜狗浏览器、360安全浏览器

  壁虎

  Mozilla 火狐 (Firefox)

  普雷斯托

  Opera浏览器

  网络套件

  Apple Safari 浏览器、Google Chrome(谷歌浏览器)和Apple Iphone 手机浏览引擎

  二、.NET 平台支持浏览器开发

  浏览器软件一般不是从头开发的,而是基于某种内核扩展。同样,微软.NET平台封装了IE浏览器内核,以COM组件的形式提供给用户。这个COM组件就是WebBrowser控件,它实现了浏览器中几乎所有的基本功能。

  WebBrowser是以IE(Trident)为核心和基本功能的Web浏览器。使用 WebBrowser 控件在 Windows 窗体应用程序中浏览网页。WebBrowser 控件位于工具箱中。使用时,只需将其直接拖至程序窗口即可。

  下面介绍WebBrowser控件的常用属性和方法

  这里我直接从MSDN中的一张表中提取来说明:

  名称说明

  文档属性

  获取一个对象,该对象提供对当前网页的 HTML 文档对象模型 (DOM) 的托管访问。

  DocumentCompleted 事件

  当页面完成加载时发生。

  文档文本属性

  获取或设置当前网页的 HTML 内容。

  文档标题属性

  获取当前网页的标题。

  返回方法

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线