php如何抓取网页内容(So,Iwanttocrawlawebpage?解析html的最佳方法 )

优采云 发布时间: 2022-01-06 05:07

  php如何抓取网页内容(So,Iwanttocrawlawebpage?解析html的最佳方法

)

  那么,我想抓取网页? [复制]

  这个问题在这里已经有了答案:10年前关闭。

  可能的重复:

  如何写一个爬虫?

  解析html

  最好的方法

  我一直想知道如何做这样的事情。我不是网站/admin/webmaster() 的所有者,但我希望获得的信息是公开的。这个页面()是所有艺术家的目录,这些目录有助于这个网站。但是此页面上的链接转到收录此锚标记的另一个页面,其中收录指向艺术家实际 网站 的链接。

  http://aaaghr.com/

  我讨厌必须订购+单击目录中的链接,然后单击艺术家的链接网站。希望浏览器标签页中会出现一批艺术家网站链接的批次,只需要暂时勾选即可。然而,简单地将这些 HREF 放入某种数组本身就是一项壮举。任何编程语言的任何想法或方向/谷歌搜索都很棒!这甚至被称为“爬行”吗?谢谢阅读!

  更新

  我在本地 PHP MAMP 服务器上使用了这个脚本和一个简单的 HTML DOM,它花了一段时间!

  $artistPages = array();

foreach(file_get_html('http://poolga.com/artists')->find('div#artists ol li a') as $element){

array_push($artistPages,$element->href);

}

for ($counter = 0; $counter find('a#author-url') as $element){

echo $element->href . '

';

}

}

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线