php如何抓取网页数据库(什么是静态页面简单来说就是固定得死页面,不需要执行脚本)
优采云 发布时间: 2022-01-22 09:08php如何抓取网页数据库(什么是静态页面简单来说就是固定得死页面,不需要执行脚本)
一、什么是静态页面静态页面就是固定死页。网页的代码存储在页面中。无需执行脚本调用数据库内容即可显示内容。如果要更新页面,则必须修改网页代码。静态页面通常以 .html、.htm、.shtml 后缀结尾。如图:1、静态页面的优点是访问速度快,没有
一、什么是静态页面
静态页面只是一个固定的死页。网页的代码存储在页面中。无需执行脚本调用数据库内容即可显示内容。如果要更新页面,则必须修改网页的代码。静态页面通常以 .html、.htm、.shtml 后缀结尾。如图所示:
1、静态页面的优点
· 访问速度快,无需连接数据库;
· 减轻服务器负担和数据库成本;
· 页面相对安全,不受asp相关漏洞的影响;
· 数据库出错不会影响网站的正常访问;
2、静态页面的缺点
服务器占用空间大,消耗内存;
· 修改更新困难,大量静态页面维护麻烦;
· 不能完美支持用户的需求(如外观选择、浏览器支持);
二、什么是动态页面
动态页面是指网页代码中收录程序代码,通过调用后台数据库中的信息与网页服务器进行交互,实时显示网页内容。一般动态页面的路径比较长,参数很多,还有“?”,后缀有.aspx、.asp、.jsp、.php等形式。部分截图:
1、动态页面的优势
· 占地面积小;
· 网页更改比较简单,可以在后台独立管理和发布更新的页面;
· 可实现更*敏*感*词*,如会员注册/登录/管理;
· 网页维护成本低,减少网站维护工作量;
2、动态页面的缺点
网页访问速度比静态页面慢;
· 蜘蛛容易陷入死循环,不利于搜索引擎收录页面;
服务器压力比较大,对服务器要求比较高;
· 由于数据的交互性,存在很大的安全隐患;
三、什么是伪静态页面
1、伪静态页面,顾名思义,是假的静态页面。伪静态页面其实是一个动态页面,但是为了对搜索引擎更加友好,通过技术处理将其路径改为与静态页面相同的路径,便于爬取。
2、从URL结构来看,伪静态页面和静态页面是一样的。它们都以 .html 和 .htm 后缀结尾,但它们只是改变了 URL 的表达方式,本质上是一个动态页面。严格来说还是在增加服务器资源消耗。
3、结合上面分析的静态页面和动态页面的优缺点,我们发现伪静态结合了静态页面和动态页面的优点,解决了静态页面占用更多空间和容量的问题,能够更好增加搜索引擎的友好度。
4、因为伪静态是浏览器在访问时使用的是正则判断而不是真实地址,所以区分显示哪个页面的责任也由原来直接指定,换成CPU判断,导致在 CPU occupancy 流量过大时,会导致 CPU 使用率超载,从而导致 网站 服务器出现问题。这也是伪静态最大的缺点。
因此,网站 使用哪个页面取决于网站 的规模和类型。一般来说,建议中小网站使用静态页面,有利于蜘蛛的访问和收录;对于较大的网站,建议在动态页面的基础上使用伪静态技术。
· 访问速度快,无需连接数据库;
· 减轻服务器负担和数据库成本;
· 页面相对安全,不受asp相关漏洞的影响;
· 数据库出错不会影响网站的正常访问;