优采云通用文章采集器正式版v2.17.7.0

优采云 发布时间: 2020-08-06 11:10

  优采云 Universal Article Collector是一个非常有用的文章采集工具. 该软件引用了搜索引擎的各种网页. 它可以非常准确地捕获文章的内容,并方便用户查找. 使用起来非常方便,就像用户来看看.

  软件简介

  优采云 Universal Article Collector是一个简单易用的文章采集工具. 用户只需要输入关键字即可快速从主要搜索引擎采集新闻来源和网页,而不再需要搜索文本. 网页. 优采云通用文章采集器不仅具有采集速度快,操作简单的特点,而且还可以准确地提取网页的文本部分并将其另存为文章,并支持去标记,链接,邮箱并转换纯文本,结果将显示给用户,消除了再次处理文本的麻烦.

  

  软件功能

  1. 可以准确提取网页的正文部分并另存为文章

  2. 支持标签,链接,电子邮件等的格式化处理.

  

  3. 插入关键字功能

  4. 可以将其插入到识别标签或标点符号旁边

  5. 识别插入英文空格

  更新日志

  优采云通用文章采集器v2.17.7.0更新日志(2020-4-8)

  1. 新添加的文本过滤功能可以阻止不属于文本的大多数内容;合并严格和标准的文本识别,并增强身体识别能力(现在识别的文本没有父div标签,全部取自内部代码);增强提取某些故意伪装的网站标题的能力;其他更新.

  2. 采集文章的URL并加强对../和../../等相对路径的处理. 对该版本进行增强处理后,相对路径将完全转换为绝对路径,该绝对路径将可以在浏览器中用鼠标移动. 请转到链接以查看相同内容.

  3. 解决由Google更改引起的收款失败的问题.

  4. 修复了在关键字集合文章列中选择精确标签时,没有弹出输入的问题(由先前版本引起);添加可选选项以根据URL集合文章列删除外部代码(默认情况下默认启用);调试模式更改这是本文的出处;更新了疑点的解释;其他人.

  5. 解决微信采集失败的问题.

  6. 增强分页采集和识别功能.

  7. 添加Google地址前缀名称,您可以设置自己可以使用的Google域名.

  8. 定期替换集合设置支持使用多个匹配和替换表达式.

  9. 增强文字识别能力,提高识别精度;增强对特殊编码响应的识别.

  10. 为辅助加载图像添加新的属性“原创”识别转换.

  11. 外部文件会更新Google翻译使用的域名;解决了Google tk参数更改时翻译失败的问题.

  12. 解决了由于系统原因无法将百度网页采集到某些情况下无法重定向到URL的问题; URL的#后缀部分将被自动删除,这将导致网页阅读错误;采集到的文章URL的左侧和右侧均添加了Insert选项;修复了由先前版本导致的文本提取过滤方面的一些问题;其他更新.

  13. 增强对某些使用跳转的网页的识别.

  14. 将标题字限制增加到最大100个字,以避免因字的长度过长而引起的一些问题;其他更新.

  优采云通用文章采集器2.15.8.0更新日志(2017年3月24日)

  修复百度网页搜索时间设置的无效性并取消百度新闻时间设置(不再支持);

  增加了采集微信时设置文本中最少单词数的支持(以前,只有自动识别可以设置单词数,但是微信具有内置的精确标签,因此无法设置单词数,现在有可能);

  [文章视图]切换显示时自动刷新目录树;

  当关键字集合中的肯定词数量不足时,会提示您设置词值

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线