抓取网页flash(用用JavaScript获获取取网网页页中的js、css、Flash等等文文件件)
优采云 发布时间: 2022-02-13 15:05抓取网页flash(用用JavaScript获获取取网网页页中的js、css、Flash等等文文件件)
但不是电子书里的js、css、Flash、背景音乐等文件。其实只要对 JavaScript 代码有一定的了解,即使只使用已经公开发布的 CtrlN,在 E 书中获取这些文件也不难。提前声明:1、下面所有的方法都是基于JavaScript的,可能会让人有兜兜转转的感觉,效果无法与直接调用非公开接口的IECracer和KillEBoo相比IE。但这只是平衡:对于打算通过反编译来学习别人做书经验的好学者来说,使用JavaScript本身就是一个练习的过程,这种方法很难用于批量反编译,所以庄家不必产生许多担忧。电子书中的背景音乐和其他文件。其实只要对 JavaScript 代码有一定的了解,即使只使用已经公开发布的 CtrlN,在 E 书中获取这些文件也不难。提前声明:1、下面所有的方法都是基于JavaScript的,可能会让人有兜兜转转的感觉,效果无法与直接调用非公开接口的IECracer和KillEBoo相比IE。但这只是平衡:对于打算通过反编译来学习别人做书经验的好学者来说,使用JavaScript本身就是一个练习的过程,这种方法很难用于批量反编译,所以庄家不必产生许多担忧。电子书中的背景音乐和其他文件。其实只要对 JavaScript 代码有一定的了解,即使只使用已经公开发布的 CtrlN,在 E 书中获取这些文件也不难。提前声明:1、下面所有的方法都是基于JavaScript的,可能会让人有兜兜转转的感觉,效果无法与直接调用非公开接口的IECracer和KillEBoo相比IE。但这只是平衡:对于打算通过反编译来学习别人做书经验的好学者来说,使用JavaScript本身就是一个练习的过程,这种方法很难用于批量反编译,所以庄家不必产生许多担忧。只要对 JavaScript 代码有一定的了解,即使只使用已经公开发布的 CtrlN,在 E 书中获取这些文件也不难。提前声明:1、下面所有的方法都是基于JavaScript的,可能会让人有兜兜转转的感觉,效果无法与直接调用非公开接口的IECracer和KillEBoo相比IE。但这只是平衡:对于打算通过反编译来学习别人做书经验的好学者来说,使用JavaScript本身就是一个练习的过程,这种方法很难用于批量反编译,所以庄家不必产生许多担忧。只要对 JavaScript 代码有一定的了解,即使只使用已经公开发布的 CtrlN,在 E 书中获取这些文件也不难。提前声明:1、下面所有的方法都是基于JavaScript的,可能会让人有兜兜转转的感觉,效果无法与直接调用非公开接口的IECracer和KillEBoo相比IE。但这只是平衡:对于打算通过反编译来学习别人做书经验的好学者来说,使用JavaScript本身就是一个练习的过程,这种方法很难用于批量反编译,所以庄家不必产生许多担忧。提前声明:1、下面所有的方法都是基于JavaScript的,可能会让人有兜兜转转的感觉,效果无法与直接调用非公开接口的IECracer和KillEBoo相比IE。但这只是平衡:对于打算通过反编译来学习别人的做书经验的好学者来说,使用JavaScript本身就是一个练习的过程,而且这种方法很难用于批量反编译,所以庄家不必产生许多担忧。提前声明:1、下面所有的方法都是基于JavaScript的,可能会让人有兜兜转转的感觉,效果无法与直接调用非公开接口的IECracer和KillEBoo相比IE。但这只是平衡:对于打算通过反编译来学习别人的做书经验的好学者来说,使用JavaScript本身就是一个练习的过程,而且这种方法很难用于批量反编译,所以庄家不必产生许多担忧。
我不杀鸡杀蛋,哈哈……2、为了方便使用,下面给出的JavaScript很笨,所有的URL解析工作都是代码完成的,只要按Ctrl+C即可, Ctrl+V 键都可以。然而,自动化毕竟有其局限性。对于大部分网页来说,这些代码应该是可以解决的。但是,如果遇到无法解决的网页,仍然需要手动分析 HTML 代码。如果在分析过程中遇到加密网页,可以使用CtrlN的“HTML Fragment”功能对加密后的HTML进行解码。在源代码中查找链接时,可以使用搜索功能快速定位。3、现在基于IE内核的电子书基本都是通过自定义协议插件实现的,对JavaScript协议插件的支持程度不一,所以不要' 如果代码在某些电子书上有错误,请不要感到惊讶。4.这些代码除了反编译电子书外,在浏览普通网页时也很有用,例如用于抓取网页中的Falsh文件。5、所有代码都是在Windows XP SP2下测试的,其他环境我没试过,但估计IE版本不能低于6.0。6、所有代码都是我的原创,个人可以免费使用。网站转载和商业利益,请先获得我的授权。二、从电子书或网页中获取文件的一般步骤从电子书或普通网页中获取各种文件的步骤基本相同,只是要输入的JavaScript代码不同:启动CtrlN。除了反编译电子书外,这些代码在浏览普通网页时也很有用,例如,它们用于捕获网页中的 Falsh 文件。5、所有代码都是在Windows XP SP2下测试的,其他环境我没试过,但估计IE版本不能低于6.0。6、所有代码都是我的原创,个人可以免费使用。网站转载和商业利益,请先获得我的授权。二、从电子书或网页中获取文件的一般步骤从电子书或普通网页中获取各种文件的步骤基本相同,只是要输入的JavaScript代码不同:启动CtrlN。除了反编译电子书外,这些代码在浏览普通网页时也很有用,例如,它们用于捕获网页中的 Falsh 文件。5、所有代码都是在Windows XP SP2下测试的,其他环境我没试过,但估计IE版本不能低于6.0。6、所有代码都是我的原创,个人可以免费使用。网站转载和商业利益,请先获得我的授权。二、从电子书或网页中获取文件的一般步骤从电子书或普通网页中获取各种文件的步骤基本相同,只是要输入的JavaScript代码不同:启动CtrlN。它们用于捕获网页中的 Falsh 文件。5、所有代码都是在Windows XP SP2下测试的,其他环境我没试过,但估计IE版本不能低于6.0。6、所有代码都是我的原创,个人可以免费使用。网站转载和商业利益,请先获得我的授权。二、从电子书或网页中获取文件的一般步骤从电子书或普通网页中获取各种文件的步骤基本相同,只是要输入的JavaScript代码不同:启动CtrlN。它们用于捕获网页中的 Falsh 文件。5、所有代码都是在Windows XP SP2下测试的,其他环境我没试过,但估计IE版本不能低于6.0。6、所有代码都是我的原创,个人可以免费使用。网站转载和商业利益,请先获得我的授权。二、从电子书或网页中获取文件的一般步骤从电子书或普通网页中获取各种文件的步骤基本相同,只是要输入的JavaScript代码不同:启动CtrlN。6、所有代码都是我的原创,个人可以免费使用。网站转载和商业利益,请先获得我的授权。二、从电子书或网页中获取文件的一般步骤从电子书或普通网页中获取各种文件的步骤基本相同,只是要输入的JavaScript代码不同:启动CtrlN。6、所有代码都是我的原创,个人可以免费使用。网站转载和商业利益,请先获得我的授权。二、从电子书或网页中获取文件的一般步骤从电子书或普通网页中获取各种文件的步骤基本相同,只是要输入的JavaScript代码不同:启动CtrlN。
这是为了防止电子书或网页禁用快捷键。如果确认没有禁用快捷键,可以省略这一步,在第3步直接按Ctrl+N。打开电子书或IE,进入引用css、js、flash等文件的页面需要被捕获。请注意,这必须是真实页面,而不是框架。如何判断框架以及如何进入框架页面将在后面讨论。将CtrlN的“快捷键行为”设置为“弹出新窗口”,然后用鼠标点击要抓取的网页,然后按Ctrl+N,会弹出一个新的IE窗口,里面显示的内容和你要抢的一样。抓取的页面内容相同,地址栏显示页面的URL。在弹出的 IE 窗口中,根据需要将对应的 JavaScript 代码(后面会给出)复制粘贴到地址栏中,然后按回车键。对于IE 6,第一次运行JavaScript代码时,地址栏下方可能会弹出一个*敏*感*词*条,表示此代码被阻止运行,点击*敏*感*词*条,选择“允许被阻止的内容”,然后重复上述步骤3、@ >4 查看结果。三、从E书或网页中获取链接的css文件 JavaScript本身提供了获取外部css文件内容的接口,所以在上述通用步骤的第4步中,将以下内容复制粘贴到IE中地址栏,然后回车查看内容:j avascript:str='';c=document.styleSheets;for(i=0;i\n';str+=o.cssText;str+='
\n';};document.write(str); 如果当前的 HTML 页面没有链接到外部 css 文件,则在第 4 步完成后将无响应或显示空白页面。这时候可以查看页面的HTML源代码进行确认。如果当前页面链接到多个 css 文件,则会显示所有 css 文件的内容。IE排版后的格式可能和原来的css代码不一样,但是效果是完全一样的。如果只显示css文件的文件名,而下面没有内容,则说明css没有打包在E书里。对于某些电子书,您还可以尝试以下代码:j javascript:str='
\n';c=document.styl eSheets;for(i=0;i';str+=o.href;str+='
\n';};str+='';document.write(str); 此代码自动检查网页。如果网页中嵌入了css文件,则自动显示css文件的下载链接,否则显示空页或无响应。在链接上单击鼠标右键,然后选择“另存为”菜单,将文件保存到硬盘。如果无法保存,将js文件的url复制到地址栏,然后回车试试。但是,如果注册表项HKEY_CLA SSES_ROOT\CSSfile\shell下有open、edit等子项,则获取的CSS代码将直接在open或edit子项指定的程序中打开,而不提示保存。这种方法的适用范围远小于上面直接展示的方法,不是所有的电子书都能用,但只要能用,它肯定会得到原创的 css 代码。四、从E书或网页获取链接的js文件 JavaScript没有提供获取js文件内容的接口,所以首先要对注册表进行改造:运行regedit,定位到HKEY_CLA SSES_ROOT\.js,并在其中添加两个字符串类型值如下: Content Type=application/xj avascript PerceivedType=text 修改的时候不放心可以参考HKEY_CLA SSES_ROOT\.css的默认设置,只是不同而已在 Content Type 的值中。注册表修改是一次性的,修改后不需要再做。转换完成后,用CtrlN抓取js文件的步骤和上面的一般步骤是一样的。在步骤 4 中,将以下内容复制并粘贴到地址栏中,
\n';c=document.scripts;for(i=0;i';str+=o.src;str+='
\n';};str+='';document.write(str); 此代码自动检查网页。如果网页中嵌入了js文件,会自动显示该js文件的下载链接,否则会显示空页或无响应。在链接上点击鼠标右键,选择“另存为”菜单,或直接点击链接;您可以将文件保存到硬盘。如果无法保存,请确认注册表是否已按照上述方法设置;如果不行,可以把js文件的url复制到地址栏,然后回车试试。诡异的是eBoo Wor shop制作的E书(页面URL以ada99:开头),在地址栏中输入js文件的URL回车,就会显示js文件的内容及其执行结果直接点击“
\n';c=document.all;f or(i=0;i'));nd.firstChild.outerHT ML=sih;no=document.createElement(nd.firstChild.outerHT ML);document.body 。appendChild(no);str+='';str+=no.src;str+='
\n';};str+='';document.write(str); 此代码自动检查网页。如果网页中嵌入了Flash对象,会自动显示swf文件的下载链接,否则会显示空页或无响应。右键单击该链接并选择“另存为”以将文件保存到您的硬盘驱动器。如果直接单击链接,将显示 Flash 屏幕。我经常看到有人问:“如何在网页上捕捉漂亮的 Flash?” 事实上,答案就是这么简单。我在上网的时候经常用这段代码来抓Flash,但是需要注意的是:如果页面是嵌入到框架中的,则需要将框架分解成真实页面后才能使用此代码。此代码还使用 createDocument tFragment 方法,并且仅适用于 IE 6。现在还有一个很极端的电子书:全书只有一个网页,里面嵌入了一个Flash文件作为记录。点击Flash中的链接,会跳转到其他Flash文件,也就是真正的内容隐藏在一堆Flash文件中。里面。这类电子书,用上面的代码一次只能抓一个Flash,需要一步一步点进去才能全部抓,有的甚至用flasm反编译抓到的Flash文件的运行脚本,然后从脚本中找出它所链接的其他Flash文件的文件名(我都是很刻薄的直接搜索.swf),然后将文件名转换为绝对URL生成下载链接。例如,如果已知 Flash 文件的绝对 URL 为 /pic.swf,则可以使用以下代码单独下载该文件:j avascript:document。write('右键另存为'); 这种方法每次都需要改变URL,当然比上面提到的方法麻烦一些,但是有时候只能用这种方法。对了,flasm真是个好东西,脚本里的一些Flash文件限制了文件只能在网络上播放,不能从本地硬盘播放,你也可以用它来解除这个限制。六、从电子书或网页中获取背景音乐文件背景音乐文件可以像Flash一样直接下载,所以在上述通用步骤的第4步中,将以下内容复制并粘贴到地址栏中,然后按回车键查看内容: j javascript:但有时只能使用这种方法。对了,flasm真是个好东西,脚本里的一些Flash文件限制了文件只能在网络上播放,不能从本地硬盘播放,你也可以用它来解除这个限制。六、从电子书或网页中获取背景音乐文件背景音乐文件可以像Flash一样直接下载,所以在上述通用步骤的第4步中,将以下内容复制并粘贴到地址栏中,然后按回车键查看内容: j javascript:但有时只能使用这种方法。对了,flasm真是个好东西,脚本里的一些Flash文件限制了文件只能在网络上播放,不能从本地硬盘播放,你也可以用它来解除这个限制。六、从电子书或网页中获取背景音乐文件背景音乐文件可以像Flash一样直接下载,所以在上述通用步骤的第4步中,将以下内容复制并粘贴到地址栏中,然后按回车键查看内容: j javascript:
\n';c=document.all;f or(i=0;i';str+=o.src;str+='
\n';};str+='';document.write(str); 此代码自动检查网页。如果嵌入了背景音乐,则会自动显示背景音乐的下载链接,否则会显示空白页面或无反应。右键单击该链接并选择“另存为”以将文件保存到您的硬盘驱动器。注意背景音乐一般隐藏在框架中(否则换页时音乐会中断)。如果弹出页面收录框架而不是实际收录背景音乐链接的页面,则不会被捕获。这时候还需要按照后面提到的步骤进入框架中的页面。另外,为了避免单调,有的电子书会一次打包好几个midi文件,并在每次运行时随机选择一首作为背景音乐。对于这样的电子书,上面的代码只能捕捉到当前的背景音乐。如果要全部捕获,只能自己分析网页源代码,结合所有背景音乐的url,然后在地址栏中输入javascript代码生成下载链接回车即可一次下载一个。请注意,您只能右键单击下载链接并选择“另存为”,不能直接单击该链接。如果实在没有能力分析网页的源码,只能跑几遍,多抓几遍。示例:如果已知音乐文件的绝对 URL 为 /1.mid,则生成下载链接的代码为:j avascript:document。write('右键另存为'); 七、From Book E 获取图片文件 在上面通用步骤的第4步中,将以下内容复制粘贴到地址栏,然后回车即可查看内容:j avascript:z=1;strUrl= '';str='' ;function getImg(){if(strUrl!=''){str+=(z++);str+='.
<IMG SRC="';str+=strUrl;str+='">
\n';};};c=document.images;for(i=0;i';str+=strU rl;str+='
\n';};};c=document.images;for(i=0;i
\n';c=document.all;f or(i=0;i';if(=='')str+=o.src;else str+=;str+='
\n';};str+='';document.write(str); 此代码自动检查网页。如果嵌入了框架(包括 iframe),则自动在框架中显示页面链接,否则显示空页面或无响应。只需单击链接即可转到相应页面。为了保证通用性,上面的代码只检查了第一层的frame,对于iframe来说问题不大,因为很少有正常人会玩嵌套的iframe;但是对于普通的框架,嵌套的 iframe 不是问题。可能性还是很大的,上面的代码需要逐层点击才能看到嵌套的框架,有点麻烦。解决方法是:如果上面的代码显示所有FRA ME,没有IFRA ME,可以使用下面的代码显示所有嵌套的frame:j avascript:str='';function getFrame(c,i,
从03开始,它提供了一个可以打开/关闭的“高级界面”。通过其中的“脚本命令”功能,可以直接将要执行的JavaScript代码或URL推送到IE窗口执行,无需在地址栏中输入。如果您已经编写了自己的 JavaScript 代码,也可以将其添加到 CtrlN.spt 文件(纯文本文件)中,以便稍后在 Script 命令选择窗口中直接选择。附录版本更新记录版本1.01 文档已根据CtrlN ver 1.03的新功能进行了修订。