www.ucaiyun.com Web内容采集器

优采云 发布时间: 2020-08-07 16:30

  编写此采集器的初衷是在我自己的工作站上添加内容,但是在小组中几个朋友的反复请求之后,它被变成了通用类型. 尽管该功能不是很强大,但现在应该仍然可以使用它. 好吧,不怕笑话,今天就发布. 如果效果很好,我将继续开发它.

  安装环境:

  此采集器是用Visual C#编写的,可以在Windows 2003下运行. 如果它在Windows 2000,XP下运行,请从Microsoft官方网站下载.net framework 1.1或更高版本的环境组件:

  附件: .net framework 1.1下载链接:

  .net framework 2.0下载链接:

  功能介绍:

  1. 多系统支持. 添加了对PHPWIND,DISCUZ,DEDECMS2.X和PHPArticle2.01的采集支持. 如果您的系统未收录在软件中,请与我们联系,并将在下一个版本“最苛刻的系统”中添加网民.

  2. 模拟用户登录,就像操作浏览器一样,但是该程序仅处理核心数据并且运行速度更快.

  3. 您可以设置是否将远程图片和Flash下载到本地(Flash文件通常很大,建议不要下载,程序会自动获取其绝对地址).

  4. 多线程,时间间隔设置可以根据您的机器性能和互联网速度或系统允许的文章发布时间进行设置

  5. 更加强大的URL采集功能,包括页面中定义区域的采集,URL的手动生成和第二级采集>

  页面功能基本上可以采集您想要的任何URL集合.

  6. 内容规则定义了多个内容过滤规则,以完全过滤掉无用的内容,例如内容中的广告.

  7. 网站采集和内容规则导入和导出功能使网民可以方便地共享采集的内容.

  8. 该论坛支持HTML和UBB发布模式.

  9. 请告诉我您是否考虑过.

  尚未添加内容存储功能,请稍后进行改进. .

  

  点击此处查看大图>

  展开/收起更多介绍

  由NSFOCUS

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线