php如何抓取网页内容(So,Iwanttocrawlawebpage?解析html的最佳方法 )
优采云 发布时间: 2022-01-06 05:07php如何抓取网页内容(So,Iwanttocrawlawebpage?解析html的最佳方法
)
那么,我想抓取网页? [复制]
这个问题在这里已经有了答案:10年前关闭。
可能的重复:
如何写一个爬虫?
解析html
最好的方法
我一直想知道如何做这样的事情。我不是网站/admin/webmaster() 的所有者,但我希望获得的信息是公开的。这个页面()是所有艺术家的目录,这些目录有助于这个网站。但是此页面上的链接转到收录此锚标记的另一个页面,其中收录指向艺术家实际 网站 的链接。
我讨厌必须订购+单击目录中的链接,然后单击艺术家的链接网站。希望浏览器标签页中会出现一批艺术家网站链接的批次,只需要暂时勾选即可。然而,简单地将这些 HREF 放入某种数组本身就是一项壮举。任何编程语言的任何想法或方向/谷歌搜索都很棒!这甚至被称为“爬行”吗?谢谢阅读!
更新
我在本地 PHP MAMP 服务器上使用了这个脚本和一个简单的 HTML DOM,它花了一段时间!
$artistPages = array();
foreach(file_get_html('http://poolga.com/artists')->find('div#artists ol li a') as $element){
array_push($artistPages,$element->href);
}
for ($counter = 0; $counter find('a#author-url') as $element){
echo $element->href . '
';
}
}