动态网页抓取(静态网页资源在网页设计中的纯HTMl格式的网页 )
优采云 发布时间: 2021-12-03 07:22动态网页抓取(静态网页资源在网页设计中的纯HTMl格式的网页
)
静态网页资源
在网页设计中,纯HTML格式(包括图片、视频、JS、CSS等样式)的网页通常被称为“静态网页”。
静态网页是相对于动态网页而言的,是指没有后台数据库、不收录任何程序、不具有交互性的网页。
静态网页的特点
开发人员写了什么,显示就是什么,一旦编写完成,就不会有任何改变。静态网页一般适用于更新较少的展示型网页,例如(酒水,家具,水果等宣传页),是很多中小网站的展示方式。
静态 Web 资源的文件扩展名是
静态网页的重要特性
例子(吃火锅、现成的蔬菜)
关于高并发架构思路
在高并发,高访问量的场景下做架构优化时,比较关键的就是把动态网页转化成静态网页,而不是直接请求数据库和动态服务器,并且可以吧静态内容推到缓存中,这样就提升用户体验,节约服务器压力成本。
动态网络资源
动态网页是和静态网页相对而言的,动态网页的url后缀一般是.asp .aspx .php .js .cgi
并且动态网页都有标志性的符号"? &",后端都有数据库的支持。
动态网址
添加新随笔
https://i.cnblogs.com/EditPosts.aspx?opt=1
动态网络资源特性
网页采用数据库技术支持,大大减少了网站的维护工作量。动态网页技术网站可以实现更*敏*感*词*,如用户注册、用户登录、投票、用户管理、博客管理等。网页不是独立存在于服务器上的网页文件。当用户请求动态节目时,服务器会解析节目并读取数据库,返回完整的网页内容。搜索引擎(爬虫)一般不会抓取“?”后面的内容。在网址中。因此,公司会制作伪静态技术页面
示例(在餐厅炒,准备做饭)
网络服务软件
互联网主流网络服务软件
ApacheIISNginxTengineTomcatLighthttpd
主流网络服务软件说明
提供动态服务的软件
网站交通条件
网站 统计一般以IP和PV值越大越好
知识产权
IP即Internet Protocol,这里是指独立ip数,不同的ip地址的计算机访问网站时被计算的总次数。独立ip数是网站流量的一个重要指标。一般相同ip地址的客户端访问网站页面一天内只会被计算一次。
这里的ip指的是是固定的公网ip
光伏
pv(Page View)即是页面浏览量,不管客户端是不是相同,也不管ip是否相同,用户只要访问网站页面就会被计算PV,一次计算一个PV。
pv的度量方法就是客户端从浏览器发出一个web请求(request),服务器接收请求返回一个页面给客户端,这样就产生一个pv。
pv是衡量网站被访问的一个标准,但并不准确有多少人访问了网站。
例如
紫外线
UV即unique visitor,同一个客户端(pc或移动端)访问网站被计算为一个访客。
一天内相同的客户端访问同一个网站只计一次uv,uv是以cookie等技术为统计依据,实际统计存在误差。
一台计算机可能有多人使用,因此uv也不是最准确的。
并发
并发数指系统同时能处理的请求数量,也反应了系统的负载能力
响应时间
响应时间是指执行一个请求从开始到最后收到响应数据所花费的总体时间。
QPS
Query Per Second
每秒查询数
服务器在一秒内处理了多少个请求,显然数字越大代表服务器的负载越高,处理能力越强。
解释一下流量术语的博客地址:
话题
1.简述dns系统的解析原理
2.简述http协议的工作原理
4.请说出状态码200,301,403,404,500,504的含义
5.请简述什么是动态网页,静态网页
6.简述http报文有哪些部分