利用网路爬虫技术快速确切寻觅目的图书的方式

优采云 发布时间: 2020-05-04 08:07

  利用网路爬虫技术快速确切寻觅目的图书的方式

  【专利摘要】本发明公开了一种借助网路爬虫技术快速确切找寻目的图书的方式,流程如下:录入电子图书构建电子图书库,将录入的图书分类装入不同的子网页中,输入须要阅读图书的关键词,利用网路爬虫技术对与目的图书有关的图书网页进行抓取,对抓取得网页进行剖析,分析后输出过滤后的图书,选择目的图书进行阅读。本发明电子图书库可以即时的录入新的电子图书,保证了该电子图书馆图书的图书种类的丰富性,采用网路爬虫技术获取目的图书愈发迅确切图书的种类仅限于文字类网络爬虫书籍,也有图片类,视频类等,该方式除了适用于电子图书馆,也适用于电子图书网站,将会为电子图书的发展带来一定的推动。

  【专利说明】利用网路爬虫技术快速确切找寻目的图书的方式

  发明领域

  [0001]本发明涉及一种阅读电子图书过程中确切快速选购目的图书的方式,属于网路【技术领域】。

  【背景技术】

  [0002]电子图书馆,是随着电版物的出现,网络通信技术的发展,而渐渐出现的。电子图书馆,具有储存能力大、速度快、保存时间长、成本低、便于交流等特性。光盘这一海量存储器、能够储存比传统图书高几千倍的信息,比微缩胶卷要多得多,而且包括图像、视频、声音,等等。利用电子技术,在这一种图书馆,我们能很快地从浩如烟海的图书中,查找到自己所须要的信息资料。这种图书馆,保存信息量的时间要长得多,不存在腐烂、生虫等问题。利用网路,在远在几千里、万里的单位、家中,都可以使用这些图书,效率极高。在广袤的书海中,想要快速确切的找到目标图书并不是这么容易,为我们阅读电子图书带来了一定的困难,阻碍了电子图书的发展。

  【发明内容】

  [0003]本发明为解决目前在电子图书馆中快速找寻目的图书的问题,提供一种借助网路爬虫技术快速确切寻觅目的图书的方式。本发明包括以下步骤:

  [0004]步骤一:录入电子图书构建电子图书库;

  [0005]步骤二:将录入的图书分类装入不同的子网页中;

  [0006]步骤三:输入须要阅读图书的关键词;

  [0007]步骤四:利用网路爬虫技术对与目的图书有关的图书网页进行抓取;

  [0008]步骤五:对抓取得网页进行剖析;

  [0009]步骤六:分析后输出过滤后的图书,选择目的图书进行阅读。

  [0010]发明疗效:本发明电子图书库可以即时的录入新的电子图书,保证了该电子图书馆图书的图书种类的丰富性,采用网路爬虫技术获取目的图书愈发迅确切图书的种类仅限于文字类,也有图片类,视频类等,该方式除了适用于电子图书馆,也适用于电子图书网站,将会为电子图书的发展带来一定的推动。

  【专利附图】

  【附图说明】

  [0011]图1为借助网路爬虫技术快速确切找寻目的图书方式的流程图。

  【具体施行方法】

  [0012]【具体施行方法】:参见借助网路爬虫技术快速确切找寻目的图书方式的流程图1,本施行方法由以下步骤组成:

  [0013]步骤一:录入电子图书构建电子图书库;

  [0014]步骤二:将录入的图书分类装入不同的子网页中;[0015]步骤三:输入须要阅读图书的关键词;

  [0016]步骤四:利用网路爬虫技术对与目的图书有关的图书网页进行抓取;

  [0017]步骤五:对抓取得网页进行剖析;

  [0018]步骤六:分析后输出过滤后的图书,选择目的图书进行阅读。

  [0019]录入的电子图书必须对其按图书的种类对其进行命名,录入的图书的子网页早已录入图书的种类赋于了不同的域名,收索须要的电子图书须要输入该图书的图书名,或所属的学科种类,网络爬虫对目的图书的收索是快速抓取目的图书的网页,在对网页上的图书进行抓取,对抓取得网页进行剖析,主要是剖析出与输入图书最接近的图书。

  [0020]对于本领域技术人员而言,显然本发明不限于上述示范性施行例的细节,而且在不背离本发明的精神或基本特点的情况下,能够以其他的具体方式实现本发明。因此网络爬虫书籍,无论从哪一点来看,均应将发明例看作是示范性的,而且是非限制性的,本发明的范围由所附权力要求而不是上述说明限定,因此借以将落在权力要求的等同要件的含意和范围内的所有变化涵盖在本发明内。不应将权力要求中的任何附图标记视为限制所涉及的权力要求。

  【权利要求】

  1.一种借助网路爬虫技术快速确切找寻目的图书的方式,其特点在于它由以下步骤实现: 步骤一:录入电子图书,建立电子图书库; 步骤二:将录入的图书分类装入不同的子网页中; 步骤三:输入须要阅读图书的关键词; 步骤四:利用网路爬虫技术对与目的图书有关的图书网页进行抓取; 步骤五:对抓取得网页进行剖析; 步骤六:分析后输出过滤后的图书,选择目的图书进行阅读。

  2.根据权力要求书I所述一种借助网路爬虫技术快速确切找寻目的图书的方式,其特点在于:步骤二中所述录入的电子图书必须对其按图书的种类对其进行命名。

  3.根据权力要求书I所述一种借助网路爬虫技术快速确切找寻目的图书的方式,其特点在于:步骤一中所述录入的图书的子网页早已录入图书的种类赋于了不同的域名。

  4.根据权力要求书I所述一种借助网路爬虫技术快速确切找寻目的图书的方式,其特点在于:步骤一中所述收索须要的电子图书须要输入该图书的图书名,或所属的学科种类。

  5.根据权力要求书I所述一种借助网路爬虫技术快速确切找寻目的图书的方式,其特点在于:步骤一中所述网路爬虫对目的图书的收索是快速抓取目的图书的网页,在对网页上的图书进行抓取。

  6.根据权力要求书I所述一种借助网路爬虫技术快速确切找寻目的图书的方式,其特点在于:步骤一中所述对抓取得网页进行剖析,主要是剖析出与输入图书最接近的图书。

  【文档编号】G06F17/30GK103744945SQ201310754637

  【公开日】2014年4月23日 申请日期:2013年12月31日 优先权日:2013年12月31日

  【发明者】朱龙腾 申请人:上海伯释信息科技*敏*感*词*

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线