最新版:网站新闻自动采集系统设计.doc
优采云 发布时间: 2020-10-08 08:01网站新闻自动采集System Design.doc
文档简介:
网站自动新闻采集系统设计.doc 网站自动新闻采集系统设计摘要:*敏*感*词*融”,“技术”和“台湾”。新闻来源主要是通过互联网采集其他国内权威新闻网站的内容,例如新华网,中国新闻网等。
此类网站新闻的真实性得到保证,具有一定的权威性,并且舆论导向相对标准化[1]。在该网站的初始阶段,安排了两名编辑每天浏览Internet,选择适当的新闻,然后将其复制并粘贴到“下什”的后台发布平台中进行发布网站。根据计算,每天通过手工方法发布大约100条新闻大约需要2-3个小时。实践证明,这种手动方法既费时又费力,因此我决定设计一套简单易用的新闻自动系统[2]。通过观察一些大型的国内新闻网站,发现大多数此类新闻网站都会根据新闻类别和发布日期创建各种新闻的新闻目录页面。例如,您可以从/china.shtml页面获得“中国新闻网”。当天发布的最新60条国内新闻目录及其链接URL。在/scroll-news/gn/2009/1013/news.shtml页面上,您可以获得2009年10月13日“中国新闻社”发布的所有国内新闻目录及其链接URL。从页面/scroll-news/ty/2009/1013/news.shtml中,您可以获得2009年10月13日“ Sina.com?D?D体育频道”发布的所有体育新闻目录及其链接URL。不同类型的网站可以根据其需求寻找不同的网站新闻来源,作为其网站新闻采集来源[3]。厦门广播电视集团网站使用ASP编辑Taodou.com上的内容,请注明出处。