php可以抓取网页数据吗(WordPress百度熊掌号接入Json_LD数据完整代码分享)
优采云 发布时间: 2021-11-14 20:06php可以抓取网页数据吗(WordPress百度熊掌号接入Json_LD数据完整代码分享)
雷雪博客与百度雄章(原百度公众号)连接已经有一段时间了。虽然暂时无法获得实际结果,但从百度站长平台雄照的数据分析来看还是不错的。中,我也分享了《WordPress百度熊掌快速开发改造教程》,今天给大家分享一下熊掌访问Json_LD数据的代码。
当然,如果你对代码一窍不通或者不想担心,子帆还提供了WordPress熊掌号访问修改插件:Fanly XZH,可以快速实现MIP页面和自适应H5页面改为熊掌号,无需修改代码。支持和转化。
首先分享一段最简单的Json_LD数据代码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
//获取文章/页面摘要
function fanly_excerpt($len=220){
if ( is_single() || is_page() ){
global $post;
if ($post->post_excerpt) {
$excerpt = $post->post_excerpt;
} else {
if(preg_match('/<p>(.*)/iU',trim(strip_tags($post->post_content,"<p>")),$result)){
$post_content = $result['1'];
} else {
$post_content_r = explode("\n",trim(strip_tags($post->post_content)));
$post_content = $post_content_r['0'];
}
$excerpt = preg_replace('#^(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,0}'.'((?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$len.'}).*#s','$1',$post_content);
}
return str_replace(array("\r\n", "\r", "\n"), "", $excerpt);
}
}
1
2
3
4
5
6
7
8
9
{
"@context": "https://ziyuan.baidu.com/contexts/cambrian.jsonld",
"@id": "",
"appid": "这里请填写熊掌号 ID",
"title": "",
"images": [""],
"description": "",
"pubDate": "",
}
其中,紫帆定制了一个文章或者页面汇总功能。如果没有设置文章摘要,会自动截取文章第一段指定长度作为摘要。
让我们继续加强这个代码。百度熊掌号在Json_LD数据中支持单缩略图和三种缩略图样式。当然,对于紫凡这样追求极致的人来说,这个晚上或许是不完美的。睡不好的人一定要这样做。子凡会直接贴出完整的推荐码。
WordPress百度熊掌号Json_LD数据完整代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
//获取文章/页面摘要
function fanly_excerpt($len=220){
if ( is_single() || is_page() ){
global $post;
if ($post->post_excerpt) {
$excerpt = $post->post_excerpt;
} else {
if(preg_match('/<p>(.*)/iU',trim(strip_tags($post->post_content,"<p>")),$result)){
$post_content = $result['1'];
} else {
$post_content_r = explode("\n",trim(strip_tags($post->post_content)));
$post_content = $post_content_r['0'];
}
$excerpt = preg_replace('#^(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,0}'.'((?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$len.'}).*#s','$1',$post_content);
}
return str_replace(array("\r\n", "\r", "\n"), "", $excerpt);
}
}
//获取文章中的图 last update 2018/01/22
function fanly_post_imgs(){
global $post;
$src = '';
$content = $post->post_content;
preg_match_all('/<img .*?src=[\"|\'](.+?)[\"|\'].*?/'/spanspan class="c339933",/span span class="c000088"$content/spanspan class="c339933",/span span class="c000088"$strResult/spanspan class="c339933",/span PREG_PATTERN_ORDERspan class="c009900")/spanspan class="c339933";/span
span class="c000088"$n/span span class="c339933"=/span span class="c990000"count/spanspan class="c009900"(/spanspan class="c000088"$strResult/spanspan class="c009900"[/spanspan class="ccc66cc"1/spanspan class="c009900"]/spanspan class="c009900")/spanspan class="c339933";/span
span class="cb1b100"if/spanspan class="c009900"(/spanspan class="c000088"$n/span span class="c339933">= 3){
$src = $strResult[1][0].'","'.$strResult[1][1].'","'.$strResult[1][2];
}elseif($n >= 1){
$src = $strResult[1][0];
}
return $src;
}
子帆建议你把上面两段代码添加到你需要访问熊掌号的主题的functions.php中,然后继续:
1
2
3
4
5
6
7
8
9
10
11
12
13
最后,您可以将上述代码添加到您的 WordPress 主题的 header.php 的适当位置。上面的代码子范也做了一个if判断,只让这段代码在文章中输出。
写在最后
和大家分享一下WordPress访问百度熊掌号的Json_LD数据代码转换。最后,如果你的WordPress站点成功连接到熊掌号,不妨试试紫帆提供的“WordPress百度熊掌号数据”提交插件”,这个插件或许可以帮你实现官方的好数据提交和 原创 推送更快。
更多WordPress优化和问题可以加群:255308000
除非另有说明,均为泪雪博客原创文章,禁止以任何形式转载
这篇文章的链接: