htmlunit抓取动态网页(动态网页的缺点主要表现在下面两个方面:缺点 )
优采云 发布时间: 2022-04-15 01:04htmlunit抓取动态网页(动态网页的缺点主要表现在下面两个方面:缺点
)
什么是动态网页?
动态网页不代表网页是动态的,如FLASH、GIF*敏*感*词*图片等JS动态图片。
所谓动态网页,是指通过ASP、PHP、Cold Fusion、CGI等程序动态生成的页面,网页中的大部分数据内容来自于网站所连接的数据库。这个页面实际上在网络空间中并不存在,所以有些人看到某个页面的内容,想下载,但自然找不到资源。动态网页只有在接收到用户的访问请求后才会生成并传输到用户的浏览器中,而且由于访问者可以实时获得他们想要的数据,动态网页往往很容易给人留下深刻的印象。此外,动态网页还具有易于维护和更新的优点。
一些细心的朋友会发现,很多网页文件的扩展名不再只是“.htm”,还有“.php”、“.asp”等,都是动态网页技术产生的。
比如一部电影网站的播放页面,一部电影网站有上千部电影,每部电影有不止一集。如果一部电影有播放页面,恐怕服务器空间放这些页面也是个问题。事实上,大多数电影网站只有一个播放页面。网页中的所有内容都是从数据库中获取的。有一天如果页面不合适,你可以只修改这样一个页面。您不需要修改每个单独的页面。静态页面。可见,动态网页占用的服务器空间较小,易于更新和维护,对管理员来说非常方便。
动态网页的缺点是什么?
动态网页的缺点主要表现在以下两个方面:
一、首先,动态网页在访问速度上并不占优势
动态网页首先获取用户的指令,然后网页将指令带到数据库中,找到该指令对应的数据,然后传输给服务器。用户看到网页。问题就出来了。每次访问网页时,都必须经过这样一个过程。这个过程至少需要几秒钟。当访问者数量较多时,页面的加载速度会变慢,这也是服务器的负担。; 从用户的角度来看,网页加载缓慢,没有响应。下次谁会访问你的 网站。
静态网页很简单。静态网页实际上是存在的,没有经过服务器编译,直接加载到客户端的浏览器中显示。
可以看出,动态网页在访问速度上并不占优势。
二、在搜索引擎中不占优势收录
上面我是从服务器和用户体验的角度讲的,下面从搜索引擎的角度讲收录。动态网页是用户输入指令后形成的页面。这个页面不存在,搜索引擎只会爬现成的,不会自己打字,网站在搜索引擎收录中没有优势。搜索引擎仍然更喜欢静态页面。
但是,搜索引擎正在不断改进。到目前为止,绝大多数搜索引擎都支持动态页面的爬取。
流行的动态网页新技术
早期的动态网页主要采用CGI技术,CGI即Common Gateway Interface(公共网关接口)。您可以使用不同的程序编写合适的 CGI 程序,例如 Visual Basic、Delphi 或 C/C++ 等。由于编程难度大、效率低、修改复杂,有逐渐被新技术取代的趋势。
以下是目前备受关注的一些比较流行的新技术:
1、PHP 是超文本预处理器,是当今 Internet 上最流行的脚本语言。它的语法借鉴了C、Java、PERL等语言,但只需要一点编程知识。可以使用 PHP 构建一个真正的交互式网站。它对HTML语言有很好的兼容性,用户可以直接在脚本代码中添加HTML标签,或者在HTML标签中添加脚本代码,更好地实现页面控制。PHP提供标准的数据库接口,数据库连接方便,兼容性强;扩展性强;可以进行面向对象的编程。
2、ASP 是活动服务器页面。它是微软开发的HTML(超文本标记语言)、脚本(Script)和CGI(通用网关接口)的组合。它不提供自己的特殊编程语言。,但允许用户使用许多现有的脚本语言编写 ASP 应用程序。ASP 编程比 HTML 更方便、更灵活。它运行在 Web 服务器端,然后将运行结果以 HTML 格式发送到客户端的浏览器。因此,ASP 比一般的脚本语言安全得多。
ASP最大的优点是可以收录HTML标签,还可以直接访问数据库,使用无限扩展的ActiveX控件,所以在编程上比HTML更方便、更灵活。通过使用ASP的组件和对象技术,用户可以直接使用ActiveX控件,调用对象方法和属性,以简单的方式实现强大的交互功能。缺点是因为基本上受限于微软的操作系统平台,主要的工作环境是微软的IIS应用程序结构,而且由于ActiveX对象具有平台特性,ASP技术在跨平台的Web服务器中不能轻易实现。在工作。
3、JSP代表Java Server Pages,是1999年6月推出的一项新技术,是一种基于Java Servlet和整个Java系统的Web开发技术。JSP和ASP在技术上有很多相似之处,但是来自不同的技术规范组织,所以ASP一般只用在Windows NT/2000平台上,而JSP可以运行在85%以上的服务器上,并且是基于JSP技术的应用程序比基于 ASP 的应用程序更易于维护和管理,因此被许多人认为是未来最有前途的动态 网站 技术。