chrome插件网页抓取(爬取Chrome浏览器；2.插件：WebScraper最后，如果你想自己动手一下)

优采云发布时间: 2022-04-16 06:18

　　在做电商的时候，消费者对产品的评论很重要，但是如果他们不知道怎么写代码呢？这是一个无需编写任何代码即可进行简单数据爬取的 Chrome 插件。下面展示了一些捕获的数据：

　　可以看到爬取的地址、评论者、评论内容、时间、商品颜色都被爬取了。那么，抓取这些数据需要哪些工具呢？只有两个：

　　1.铬；

　　2. 插件：网络爬虫

　　最后，如果你想自己爬，这里是这个爬的详细过程：

　　1.首先复制下面的代码，是的，你不需要写代码，但是要上手，还是需要复制代码，以后可以自己自定义选择，你不需要写代码。

　　{

　　"_id": "jdreview",

　　“startUrl”：[

　　],

　　“选择器”：[

　　{

　　“id”：“用户”，

　　"type": "SelectorText",

　　“选择器”：“div.user-info”，

　　“父选择器”：[

　　“主要”

　　],

　　“多个”：假，

　　"正则表达式": "",

　　“延迟”：0

　　},

　　{

　　“id”：“评论”，

　　"type": "SelectorText",

　　“选择器”：“ment-column > ment-con”，

　　“父选择器”：[

　　“主要”

　　],

　　“多个”：假，

　　"正则表达式": "",

　　“延迟”：0

　　},

　　{

　　“id”：“时间”，

　　"type": "SelectorText",

　　"selector": "ment-message:nth-of-type(5) span:nth-of-type(4), div.order-info span:nth-of-type( 4)",

　　“父选择器”：[

　　“主要”

　　],

　　“多个”：假，

　　"正则表达式": "",

　　“延迟”：“0”

　　},

　　{

　　“id”：“颜色”，

　　"type": "SelectorText",

　　"selector": "div.order-info span:nth-of-type(1)",

　　“父选择器”：[

　　“主要”

　　],

　　“多个”：假，

　　"正则表达式": "",

　　“延迟”：0

　　},

　　{

　　“id”：“主”，

　　"type": "SelectorElementClick",

　　“选择器”：“ment-item”，

　　“父选择器”：[

　　“_root”

　　],

　　“多个”：真，

　　“延迟”：“10000”，

　　"clickElementSelector": "-table-footer a.ui-pager-next",

　　"clickType": "clickMore",

　　“discardInitialElements”：假，

　　"clickElementUniquenessType": "uniqueHTMLText"

　　}

　　]

　　}

　　2.然后打开chrome浏览器，在任意页面同时按下Ctrl+Shift+i，在弹窗中找到Web Scraper，如下：

　　3.如下

　　4. 如图，粘贴上面的代码：

　　5. 如图，如果需要自定义URL，注意替换。 URL 后面的#comment 是评论的直接链接，不能删除：

　　6.如图：

　　7.如图：

　　8. 如图，点击抓取后会自动打开需要抓取的页面，不要关闭窗口，等待完成。问题：

　　9.最后点击下载到电脑，数据就保存好了。

　　使用这个工具的好处是：

　　1. 无需编程；

　　2.京东的评论基本可以用这个脚本，修改对应的url即可；

　　3.如果要抓取的评论少于1000条，这个工具会很方便，所有数据都会自动下载；

　　使用注意事项：

　　1. 捕获一次的数据会被记录下来，如果立即再次捕获则不会保存。建议关闭浏览器重新打开再试；

　　2.爬取次数：1000以内没问题，可能是京东直接根据IP屏蔽了更多的爬取；

　　如果你的英文不错，可以尝试阅读官方文档，进一步学习和定制自己的爬虫。

　　以上就是本文的全部内容。希望对大家的学习有所帮助，也希望大家多多支持。

0

2022-04-16

chrome插件网页抓取

0 个评论

要回复文章请先登录或注册

AI时代内容工厂

chrome插件网页抓取(爬取Chrome浏览器；2.插件：WebScraper最后，如果你想自己动手一下)

0 个评论

发起人

AI时代内容工厂

chrome插件网页抓取(爬取Chrome浏览器；2.插件：WebScraper最后，如果你想自己动手一下)

0 个评论

发起人

相关问题