网页flash文本抓取器(阿维申·皮莱:如何获取完整文本字段的任何想法 )
优采云 发布时间: 2021-10-05 08:09网页flash文本抓取器(阿维申·皮莱:如何获取完整文本字段的任何想法
)
艾维森皮莱
我正在查看从 网站 获取文本数据并尝试从特定部分获取所有文本的示例,尤其是文本框有一个名为“阅读更多”的字段。
我尝试了不同的 css 选择器(使用 Selector Gadget 识别)但没有成功,并且捕获的文本并非所有可用文本。
关于如何获取完整文本字段的任何想法?
谢谢!
library(rvest)
link = "https://www.property24.com/for-sale/camps-bay/cape-town/western-cape/11014/109734849"
html_link = read_html(link)
# Method 1
text1 = html_link %>%
html_nodes(css = ".js_readMoreText") %>%
html_text()
text1
# Method 2
text2 = html_link %>%
html_nodes(css = ".js_readMore") %>%
html_text()
text2
# Method 3
text3 = html_link %>%
html_nodes(css = ".expanded , .js_readMoreText") %>%
html_text()
text3
哈尔
内容存储在元标记的内容属性中。您可以选择如下:
<p>library(rvest)
link