python抓取网页数据(我正在尝试抓取*敏*感*词*,但是即使我使用“按ID查找元素”,结果还是一个文本。)

优采云 发布时间: 2021-11-29 19:23

  python抓取网页数据(我正在尝试抓取*敏*感*词*,但是即使我使用“按ID查找元素”,结果还是一个文本。)

  我正在尝试获取*敏*感*词*,但即使我使用“按 ID 查找元素”,结果仍然是文本。我尝试了各种方法,例如通过 xpath 查找元素等。我尝试通过查找“属性‘目标’”来创建一个收录所有 ID 的数组,以便我可以遍历它,但我没有成功,所以我必须对每个 ID 进行编码。

  import json

from bs4 import BeautifulSoup

from selenium import webdriver

from selenium.webdriver.support.ui import WebDriverWait

url = 'http://www.tsetmc.com/Loader.aspx?ParTree=15131F'

delay = 100

driver = webdriver.Chrome()

driver.get(url)

WebDriverWait(driver, delay)

zapna = driver.find_elements_by_id(id_='43479730079120887')

renik = driver.find_elements_by_id(id_='33854964748757477')

retko = driver.find_elements_by_id(id_='3823243780502959')

rampna = driver.find_elements_by_id(id_='67126881188552864')

mafakher = driver.find_elements_by_id(id_='4247709727327181')

for ii in retko:

print(ii.text , "\n")

driver.close()

  结果是:

  رتكوكنترل‌خوردگي‌تكين‌كو2,1512.531M63.044 B25,14523,88824,900-245-0.9724,907-238-0.9523,88825,699-749-33.2512,55324,90024,9035,4601

  我期望的是:

  رتكو

كنترل‌خوردگي‌تكين‌كو

2,151

2.531M

63.044 B

25,145

23,888

24,900

-245

-0.97

24,907

-238

-0.95

23,888

25,699

-749

-33.25

1

2,553

24,900

24,903

5,460

1

  有什么想法吗?

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线