php可以抓取网页数据吗(WordPress百度熊掌号接入Json_LD数据完整代码分享)

优采云 发布时间: 2021-11-14 20:06

  php可以抓取网页数据吗(WordPress百度熊掌号接入Json_LD数据完整代码分享)

  雷雪博客与百度雄章(原百度公众号)连接已经有一段时间了。虽然暂时无法获得实际结果,但从百度站长平台雄照的数据分析来看还是不错的。中,我也分享了《WordPress百度熊掌快速开发改造教程》,今天给大家分享一下熊掌访问Json_LD数据的代码。

  当然,如果你对代码一窍不通或者不想担心,子帆还提供了WordPress熊掌号访问修改插件:Fanly XZH,可以快速实现MIP页面和自适应H5页面改为熊掌号,无需修改代码。支持和转化。

  

  首先分享一段最简单的Json_LD数据代码:

  1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

  //获取文章/页面摘要

function fanly_excerpt($len=220){

if ( is_single() || is_page() ){

global $post;

if ($post->post_excerpt) {

$excerpt = $post->post_excerpt;

} else {

if(preg_match('/<p>(.*)/iU',trim(strip_tags($post->post_content,"<p>")),$result)){

$post_content = $result['1'];

} else {

$post_content_r = explode("\n",trim(strip_tags($post->post_content)));

$post_content = $post_content_r['0'];

}

$excerpt = preg_replace('#^(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,0}'.'((?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$len.'}).*#s','$1',$post_content);

}

return str_replace(array("\r\n", "\r", "\n"), "", $excerpt);

}

}

  1

2

3

4

5

6

7

8

9

  {

"@context": "https://ziyuan.baidu.com/contexts/cambrian.jsonld",

"@id": "",

"appid": "这里请填写熊掌号 ID",

"title": "",

"images": [""],

"description": "",

"pubDate": "",

}

  其中,紫帆定制了一个文章或者页面汇总功能。如果没有设置文章摘要,会自动截取文章第一段指定长度作为摘要。

  让我们继续加强这个代码。百度熊掌号在Json_LD数据中支持单缩略图和三种缩略图样式。当然,对于紫凡这样追求极致的人来说,这个晚上或许是不完美的。睡不好的人一定要这样做。子凡会直接贴出完整的推荐码。

  WordPress百度熊掌号Json_LD数据完整代码

  1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

  //获取文章/页面摘要

function fanly_excerpt($len=220){

if ( is_single() || is_page() ){

global $post;

if ($post->post_excerpt) {

$excerpt = $post->post_excerpt;

} else {

if(preg_match('/<p>(.*)/iU',trim(strip_tags($post->post_content,"<p>")),$result)){

$post_content = $result['1'];

} else {

$post_content_r = explode("\n",trim(strip_tags($post->post_content)));

$post_content = $post_content_r['0'];

}

$excerpt = preg_replace('#^(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,0}'.'((?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$len.'}).*#s','$1',$post_content);

}

return str_replace(array("\r\n", "\r", "\n"), "", $excerpt);

}

}

 

//获取文章中的图 last update 2018/01/22

function fanly_post_imgs(){

global $post;

$src = '';

$content = $post->post_content;

preg_match_all('/<img .*?src=[\"|\'](.+?)[\"|\'].*?/'/spanspan class="c339933",/span span class="c000088"$content/spanspan class="c339933",/span span class="c000088"$strResult/spanspan class="c339933",/span PREG_PATTERN_ORDERspan class="c009900")/spanspan class="c339933";/span

span class="c000088"$n/span span class="c339933"=/span span class="c990000"count/spanspan class="c009900"(/spanspan class="c000088"$strResult/spanspan class="c009900"[/spanspan class="ccc66cc"1/spanspan class="c009900"]/spanspan class="c009900")/spanspan class="c339933";/span

span class="cb1b100"if/spanspan class="c009900"(/spanspan class="c000088"$n/span span class="c339933">= 3){

$src = $strResult[1][0].'","'.$strResult[1][1].'","'.$strResult[1][2];

}elseif($n >= 1){

$src = $strResult[1][0];

}

return $src;

}

  子帆建议你把上面两段代码添加到你需要访问熊掌号的主题的functions.php中,然后继续:

  1

2

3

4

5

6

7

8

9

10

11

12

13

  最后,您可以将上述代码添加到您的 WordPress 主题的 header.php 的适当位置。上面的代码子范也做了一个if判断,只让这段代码在文章中输出。

  写在最后

  和大家分享一下WordPress访问百度熊掌号的Json_LD数据代码转换。最后,如果你的WordPress站点成功连接到熊掌号,不妨试试紫帆提供的“WordPress百度熊掌号数据”提交插件”,这个插件或许可以帮你实现官方的好数据提交和 原创 推送更快。

  更多WordPress优化和问题可以加群:255308000

  除非另有说明,均为泪雪博客原创文章,禁止以任何形式转载

  这篇文章的链接:

0 个评论

要回复文章请先登录注册


官方客服QQ群

微信人工客服

QQ人工客服


线