python抓取网页数据(我正在尝试抓取*敏*感*词*,但是即使我使用“按ID查找元素”,结果还是一个文本。)
优采云 发布时间: 2021-11-29 19:23python抓取网页数据(我正在尝试抓取*敏*感*词*,但是即使我使用“按ID查找元素”,结果还是一个文本。)
我正在尝试获取*敏*感*词*,但即使我使用“按 ID 查找元素”,结果仍然是文本。我尝试了各种方法,例如通过 xpath 查找元素等。我尝试通过查找“属性‘目标’”来创建一个收录所有 ID 的数组,以便我可以遍历它,但我没有成功,所以我必须对每个 ID 进行编码。
import json
from bs4 import BeautifulSoup
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
url = 'http://www.tsetmc.com/Loader.aspx?ParTree=15131F'
delay = 100
driver = webdriver.Chrome()
driver.get(url)
WebDriverWait(driver, delay)
zapna = driver.find_elements_by_id(id_='43479730079120887')
renik = driver.find_elements_by_id(id_='33854964748757477')
retko = driver.find_elements_by_id(id_='3823243780502959')
rampna = driver.find_elements_by_id(id_='67126881188552864')
mafakher = driver.find_elements_by_id(id_='4247709727327181')
for ii in retko:
print(ii.text , "\n")
driver.close()
结果是:
رتكوكنترلخوردگيتكينكو2,1512.531M63.044 B25,14523,88824,900-245-0.9724,907-238-0.9523,88825,699-749-33.2512,55324,90024,9035,4601
我期望的是:
رتكو
كنترلخوردگيتكينكو
2,151
2.531M
63.044 B
25,145
23,888
24,900
-245
-0.97
24,907
-238
-0.95
23,888
25,699
-749
-33.25
1
2,553
24,900
24,903
5,460
1
有什么想法吗?