自动文章采集(自动文章采集列表页很多很多，这个用的什么库)

优采云发布时间: 2022-04-15 23:01

　　自动文章采集列表页很多很多，我去年把这个列表页和收藏页爬了一遍。用的开源js库，不过在学习chrome各种扩展的同时需要了解css,sass,less。另外有一个叫做：你可以看一下这个文章看下这个用的什么库。

　　看这个开源项目：

　　推荐quan_pc：登录

　　企业级的也有需求么？

　　/pages/all/

　　w3cschool国内教程网站，不仅有工具，

　　可以使用socketcgt工具

　　发一个最近的爬虫吧

　　上面有推荐javascript，但是我想说别忘了浏览器的原生ui啊，

　　推荐一个javascript爬虫工具：proxyeehives

　　收藏夹自动刷新，百度搜索，都可以设定ua，

　　同问有很多采集框的页面

　　目前正在写爬虫，但是又在搞markdown，打算一边玩一边完善。我试着写了采集框排序、搜索引擎（google、bing）、微博等多个需求点。

　　。

　　推荐使用avaco

　　然后一直没怎么写，用各种自动化，直到慢慢的他就没法用了。python是理想选择，但我不推荐markdown2pi和wordpress自动化框架。其实还是抓网页吧，抓得数量多了，自然用浏览器原生ui响应了。

　　第一反应，爬虫，可以用apache爬虫框架（fuse4j和doc2me）。然后自己写一套脚本，可爬不可控。

　　有个外国的东西

0

2022-04-15

自动文章采集

0 个评论

要回复文章请先登录或注册