php抓取网页程序(phantomjs截取网页截图WebKit截取引擎截取网站快照生成)
优采云 发布时间: 2021-09-16 16:18php抓取网页程序(phantomjs截取网页截图WebKit截取引擎截取网站快照生成)
Phantomjs网页截图
WebKit是一个开源浏览器引擎。相应的引擎是gecko(由Mozilla Firefox等使用)和Trident(也称为mshtml,由IE使用)
参考资料来源:
代码示例:
Phantomjs和slimerjs都是服务器端JS。简而言之,它们都封装了浏览器解析引擎。区别在于phantomjs封装webkti,slimerjs封装gecko(Firefox)。权衡利弊,我决定研究phantomjs,因此我实现了使用phantomjs生成网站快照。phantomjs的项目地址为:
代码包括两部分,一部分是用于设计业务的index.php,另一部分是用于生成快照的JS脚本snapshot.JS。代码相对简单。它只实现了功能,没有太多的修改。代码如下:
php:
html
快照生成
* {
margin: 0;
padding: 0;
}
form {
padding: 20px;
}
div {
margin: 20px 0 0;
}
input {
width: 200px;
padding: 4px 2px;
}
#placeholder {
display: none;
}
生成快照
$(function(){
$('#form').submit(function(){
if (typeof($(this).data('generate')) !== 'undefined' && $(this).data('generate') === true)
{
alert('正在生成网站快照,请耐心等待...');
return false;
}
$(this).data('generate', true);
$('button').text('正在生成快照...').attr('disabled', true);
$.ajax({
type: 'GET',
url: '?',
data: 'url=' + $('#url').val(),
success: function(data){
$('#placeholder').attr('src', data).show();
$('#form').data('generate', false);
$('button').text('生成快照').attr('disabled', false);
}
});
return false;
});
});
PHP使用cutycapt实现网页的高清截图:
Ie+cutycapturl:要截屏的网页:图像保存路径:cutycapt路径CMD:cutycapt执行命令,例如:您的PHP路径。PHP?网址=
CutyCapt下载地址:http://sourceforge.net/projects/cutycapt/files/cutycapt/
windows的不用安装的,直接下载解压放到相对应的路径即可
linux安装CutyCapt教程:http://niutuku9.com/tech/php/273578.shtml
整理参考:软联盟