网页信息抓取软件(Python巡游您可以使用以下代码从所需的网站上抓取数据 )
优采云 发布时间: 2022-04-12 07:30网页信息抓取软件(Python巡游您可以使用以下代码从所需的网站上抓取数据
)
剑客
我对网络抓取真的很陌生,我正在做一个项目,我需要从加载并需要滚动以获取所有值的网格中抓取数据。
页面为 ( )。
我需要网格内的所有数据 - (收录数据名称、类别、子类别、风险、技术)。
谁能指导我一步一步解决这个问题。我做了研究,发现带有 js 或 phantomjs 的 selenium 可能是一个很好的解决方案,但不确定。我将在编程部分使用 Python。
巡航
您可以使用以下代码从 网站 中获取所需的所有内容:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
driver = webdriver.Chrome(executable_path = r'C:/Users/abhishep/Downloads/chromedriver_win32/chromedriver.exe')
driver.maximize_window()
driver.get("https://applipedia.paloaltonetworks.com/")
wait = WebDriverWait(driver,30)
table = wait.until(EC.presence_of_all_elements_located((By.CSS_SELECTOR, 'tbody#bodyScrollingTable tr')))
for tab in table:
print(tab.text)