jquery抓取网页内容(我正在开发一个项目获取有限的内容..() )
优采云 发布时间: 2021-10-19 02:19jquery抓取网页内容(我正在开发一个项目获取有限的内容..()
)
问题
我正在开发一个项目。为此,我想在后台抓取网站的内容,并从抓取的网站中获取一些有限的内容。例如,在我的页面中,我有“用户名”和“密码”字段,通过使用这些字段,我将访问我的邮件并抓取收件箱中的内容并将其显示在我的页面上。
我单独使用javascript完成了上述操作。但是,当我点击“登录”按钮时,页面的 URL () 被更改为网址 (/mails/inbox.php?nomail = ... .) 并被抓住了...但我取消了详细信息而不更改 URL。
解决方案
请务必使用 PHP 简单的 HTML DOM 解析器。它快速、简单且超级灵活。它基本上将整个 HTML 页面粘贴到一个对象中,然后您可以访问该对象中的任何元素。
以官方网站为例,获取Google首页的所有链接:
// Create DOM from URL or file
$html = file_get_html('http://www.google.com/');
// Find all images
foreach($html->find('img') as $element)
echo $element->src . '
';
// Find all links
foreach($html->find('a') as $element)
echo $element->href . '
';