java爬虫抓取动态网页(这是移动端微博信息_selenium_sina__)

优采云发布时间: 2021-10-18 05:13

　　这是一个新浪微博爬虫，使用python+selenium实现。免费资源，希望对你有帮助，虽然是傻瓜式爬虫，但至少能跑。同时在rar中收录了源代码和爬取示例。参考我的文章：【python爬虫】Selenium爬取新浪微博内容和用户信息【python爬虫】Selenium爬取新浪微博客户端用户信息、热点话题和评论（上）主要爬取内容包括：新浪微博手机用户信息和微博信息。用户信息：包括用户ID、用户名、微博数、粉丝数、关注数等微博信息：包括转发或原创、点赞数、转发数、评论数、发布时间、微博内容等安装过程：1. 先安装Python环境，作者是Python2.7.82.然后安装pip或者easy_install3.通过命令pip install selenium来安装selenium，是一个自动测试爬取工具4.然后修改代码中的用户名和密码，填写自己的用户名和密码5.运行程序，自动调用火狐浏览器登录到微博。注：手机信息更精致简洁，动态加载没有限制，只是显示微博或粉丝id等20个页面，这是它的缺点；虽然客户端可能有动态加载，比如评论和微博，但它的信息更完整。【源码】爬取手机微博信息spider_selenium_sina_content.py 输入：

0

2021-10-18

java爬虫抓取动态网页

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

java爬虫抓取动态网页(这是移动端微博信息_selenium_sina__)

0 个评论

发起人