js提取指定网站内容(js提取指定网站内容你可以使用一些提取特定网站的插件)
优采云 发布时间: 2021-09-23 20:04js提取指定网站内容(js提取指定网站内容你可以使用一些提取特定网站的插件)
js提取指定网站内容
你可以使用一些提取特定网站内容的插件,例如我比较喜欢用thmahi,它是按照url地址抓取网页,同时提取网页指定区域的文字,
使用爬虫插件,
免费导出到excel的编程语言有很多,用python,java,javascript等语言都可以实现。当然,如果这个网站支持oauth(@/)的话,还可以把url地址提供给爬虫,让爬虫自己去爬数据。
oauth
python的话我不知道,写网站js的php,mysql,perl都有专门写js,urls的库的。
ps||ppt||css||js||vba||php||mysql||c#||java||python||php||png||其实php做个爬虫就好了,
任何语言都可以,百度一下,知乎就有好多技术大牛写的爬虫,可以参考。
python+django或者python+twitter+thunder
vba/office文档脚本语言
你可以打个支持bmap的爬虫,并命名为bmap.xxx,将抓取到的数据命名为urls.xxx.xxx,然后导出为xml格式。
任何语言都可以,我用java实现的jsoup(就是一个加载的文档).我就在代码中写了这么一句:即能抓取源文件又能抓取提取数据.