自动采集子系统(科学技术是第一生产力,万维网(WorldWideWeb))

优采云 发布时间: 2021-11-28 14:29

  自动采集子系统(科学技术是第一生产力,万维网(WorldWideWeb))

  随着互联网技术的飞速发展,互联网已经成为人们进行社会、经济、文化、教育、娱乐等活动不可缺少的媒介。互联网的重要组成部分之一,万维网(World WideWeb)承载着大量的数据和信息,包括各种类型和形式的信息,从科技信息、新闻报道,到商业信息、教育材料。动态异构分布式信息资源库。由于其使用的方便性和显示能力的多样性,通过WEB获取信息和知识已成为不可缺少的渠道。根据中国互联网络信息中心(CNNIC)发布的第31次中国互联网络发展统计报告,截至 2012 年 12 月末,中国网民规模达 64 亿,互联网普及率为 42.1%,网民每周平均花费 20.5 小时在互联网。中国网站的数量为268万,网页数量高达1227亿。每个网页的平均字节数为 42KB,而且这些数据还在不断增长。互联网飞速发展的好处是它所收录的信息非常丰富,但同时也给我们带来了更加严峻的挑战,即如何根据用户的兴趣从海量的WEB信息中高效获取信息是当前互联网应用面临一个难题。“科学技术是第一生产力”,“

<p>个人或企业的发展方式逐渐从传统转变为依靠科技。科学技术发展迅猛,科技信息日新月异。在当今互联网信息时代,人们获取科技信息的方式不再局限于传统的教室和书籍。相反,从互联网上获取科技信息已经成为一种更加方便快捷的方式[54][55]。将这么多科技信息的内容聚合起来,不仅难以保证内容的及时性,如果仅靠人工方式获取,还要耗费相当多的时间和精力。那么,更方便的方法是使用程序自动&lt; @采集信息源的内容(例如科技信息源网站中的内容),最终将结果以个性化的方式展示在终端上。本文实施的科技信息自动跟踪管理系统是与北京市某单位合作的科技项目的一个子系统。本文的主要任务是研究开发一套科技信息自动跟踪管理系统。该技术项目的总体结构如图1-1所示。目前,市场上已经有一些专门的网页信息

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线