网页flash文本抓取器(阿维申·皮莱:如何获取完整文本字段的任何想法 )

优采云 发布时间: 2021-10-05 08:09

  网页flash文本抓取器(阿维申·皮莱:如何获取完整文本字段的任何想法

)

  艾维森皮莱

  我正在查看从 网站 获取文本数据并尝试从特定部分获取所有文本的示例,尤其是文本框有一个名为“阅读更多”的字段。

  我尝试了不同的 css 选择器(使用 Selector Gadget 识别)但没有成功,并且捕获的文本并非所有可用文本。

  关于如何获取完整文本字段的任何想法?

  谢谢!

  library(rvest)

link = "https://www.property24.com/for-sale/camps-bay/cape-town/western-cape/11014/109734849"

html_link = read_html(link)

# Method 1

text1 = html_link %>%

html_nodes(css = ".js_readMoreText") %>%

html_text()

text1

# Method 2

text2 = html_link %>%

html_nodes(css = ".js_readMore") %>%

html_text()

text2

# Method 3

text3 = html_link %>%

html_nodes(css = ".expanded , .js_readMoreText") %>%

html_text()

text3

  哈尔

  内容存储在元标记的内容属性中。您可以选择如下:

<p>library(rvest)

link

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线