java爬虫抓取网页数据(这是移动端微博信息_selenium_sina__)
优采云 发布时间: 2022-04-19 16:09java爬虫抓取网页数据(这是移动端微博信息_selenium_sina__)
这是新浪微博爬虫,使用python+selenium实现。免费资源,希望对你有所帮助,虽然是傻瓜式爬虫,但至少可以运行。同时rar收录源码和爬取示例。参考我的文章:【python爬虫】Selenium爬取新浪微博内容和用户信息【Python爬虫】Selenium爬取新浪微博客户端用户信息、热门话题和评论(上)主要爬取内容包括:新浪微博手机终端用户信息和微博信息。用户信息:包括用户ID、用户名、微博数、关注数、关注数等微博信息:包括转发或原创、点赞数、转发数、评论数、发布时间、微博内容等安装过程:1. 先安装Python环境,作者是Python2.7.82.然后安装pIP或者easy_install3.通过命令pip install selenium安装selenium,是一个工具进行自动测试爬取4.然后修改代码中的用户名和密码,填写自己的用户名和密码5.运行程序,自动调用火狐浏览器登录微博注意:移动端信息比较精致简洁,对动态加载没有一些限制,但是只显示微博或者粉丝id等20个页面,这是它的缺点;虽然客户端可能有动态加载,比如评论和微博,但它的信息更完整。【源码】抓取手机端微博信息spider_selenium_sina_content。