使用Python实现自动wordpress采集和更新
优采云 发布时间: 2020-08-06 12:15最近,我用wordpress制作了一个小型网站. 目的很简单. 我想更新这本小说,并尽快将其发布到wordpress. 我本来想用优采云解决它,但是没有模块流氓,我不得不自己用python编写. 我本来想使用mysqldb直接插入,但是wordpress表单确实有点麻烦,并且远程速度有点慢. 我以为python的主要思想不是重塑轮子,所以我在pypi中找到了wordpress_xmlrpc模块,没有提到主要功能,请参考官方网站了解详细信息:
当前,wordpress_xmlrpc模块已更新为2.2版,但我使用的是1.5版. 懒惰的学生可以在centos下像这样安装它.
Wget-不检查证书
tar zxf python-wordpress-xmlrpc-1.5.tar.gz
cd python-wordpress-xmlrpc-1.5
python setup.py安装
好的,这里介绍了wordpress_xmlrpc模块. 有关其他功能,请访问官方网站. 让我谈谈程序的想法.
1. 使用记事本记录已爬网的URL.
2. 再次获取该页面,以获取此页面上文章的完整URL.
3. 检查此页面的所有URL是否都在TXT中.
4. 如果没有,请获取URL的标题和内容,然后将其发送给wordpress,然后将URL写入txt
5. 最后,使用crontab自动化任务并每天定期运行.
<p>代码如下: (为了防止某些学生一无所获,将代码替换为图片,红色部分是URL,帐号,密码和保存URL地址的txt)