java爬虫抓取网页数据(这是移动端微博信息_selenium_sina__)

优采云发布时间: 2022-04-19 16:09

　　这是新浪微博爬虫，使用python+selenium实现。免费资源，希望对你有所帮助，虽然是傻瓜式爬虫，但至少可以运行。同时rar收录源码和爬取示例。参考我的文章：【python爬虫】Selenium爬取新浪微博内容和用户信息【Python爬虫】Selenium爬取新浪微博客户端用户信息、热门话题和评论（上）主要爬取内容包括：新浪微博手机终端用户信息和微博信息。用户信息：包括用户ID、用户名、微博数、关注数、关注数等微博信息：包括转发或原创、点赞数、转发数、评论数、发布时间、微博内容等安装过程：1. 先安装Python环境，作者是Python2.7.82.然后安装pIP或者easy_install3.通过命令pip install selenium安装selenium，是一个工具进行自动测试爬取4.然后修改代码中的用户名和密码，填写自己的用户名和密码5.运行程序，自动调用火狐浏览器登录微博注意：移动端信息比较精致简洁，对动态加载没有一些限制，但是只显示微博或者粉丝id等20个页面，这是它的缺点；虽然客户端可能有动态加载，比如评论和微博，但它的信息更完整。【源码】抓取手机端微博信息spider_selenium_sina_content。

0

2022-04-19

java爬虫抓取网页数据

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

java爬虫抓取网页数据(这是移动端微博信息_selenium_sina__)

0 个评论

发起人