百度搜索指定网站内容(绑host测试,能正常ip访问则搭建完成。。)
优采云 发布时间: 2021-11-01 22:08百度搜索指定网站内容(绑host测试,能正常ip访问则搭建完成。。)
原文链接:
GitHub Pages构建的网站,百度搜索引擎访问时,经常会返回403 forbidden,所以百度会认为网站的访问不稳定,而网站的权限会被降级,甚至K站。
要解决这个问题,就得自己买个VPS,自己做一个jekyll分析博客。但是我的域名没有备案。单纯使用国外的VPS会导致用户访问速度变慢。毕竟Github Pages的CDN还是很给力的(页面响应时间200ms左右)。有什么办法可以让百度爬虫抓取国外VPS上的内容,普通用户可以直接访问Github Pages?
现在技术这么先进,这东西当然是小事一桩了。一般大公司的域名解析可以由省、运营商等来做;常用的DNSPOD也支持这么棒的功能。免费用户可根据电信、联通、教育网、百度、搜索引擎等设置分辨率,付费用户可分为省、国家、洲等。对于我的小博客来说,免费的已经足够了。
下面是我的折腾过程,记录一下备忘录。
安装 Jekyll
Jekyll 是基于 Ruby 开发的,使用 Ruby 的 execjs 方法来执行 JavaScript 代码,这需要你指定一个 JavaScript 运行时;这里我们选择安装Node.js。
sudo yum install libtool automake autoconf gcc-c++ openssl-devel wget
mkdir ~/soft/
cd ~/soft/
wget http://nodejs.org/dist/v0.12.4/node-v0.12.4.tar.gz
tar -zxvf node-v0.12.4.tar.gz
cd node-v0.12.4
./configure --prefix=/usr
make && sudo make install
node -v
npm -v
sudo yum install ruby ruby-devel gem
gem install jekyll
建立一个博客站点
sudo yum install git
sudo mkdir -p ~/mydomain.com/
git clone https://github.com/username/username.github.io.git ./
配置crontab 2分钟拉取代码:
crontab -e
# 添加下面的代码:
*/2 * * * * cd ~/mydomain.com/; git pull >> /tmp/github_blog_pull_record.log 2>&1;
Jekyll 2.4 版本之后,会关注文件变化,自动重新生成静态文件。使用--detach参数指定后台执行,--port指定端口,--host指定当前机器的外网ip。
cd ~/mydomain.com/
jekyll serve --port 80 --host 192.168.1.101 --detach
绑定主机进行测试,如果可以正常访问则设置完成。Jekyll 的更多使用请参考文档:。