胖鼠采集是一款很好用的采集文章到WordPress的插件,但是因为毕竟是付费时代,不可能免费把所有功能都给你使用,所以里面就有限制,最多只能配置5个采集规则,这就很烦了,因为对于不同的网站,采集规则是不一样的,如果你想要有多个采集你就要付费了,这里介绍一种方法,可以解除限制
进入到胖鼠采集插件的后台文件夹中
在这个文件里找到他的默认采集规则,然后复制修改就可以了
比如说我复制新建一个百度经验采集规则
里面的参数如collect_content_rules采集规则,可以自己在debuging里调试,其他规则也可以根据自己采集的网站进行相应调整
然后到配置页面
点击演示例子,就会把我们之前配置的采集规则录入进去了,此时就算规则数超过5个也不会报错,但是不能再在这里面修改了,只能在后台文件里面修改,然后删除后重新点击演示例子录入进去
对于采集文章时会出现图片无法采集的问题,比如采集百度经验页面的文章,在采集时如果图片源属性没有设置正确可能就会采集不到图片
图片只能显示alt属性,没有图片
但如何知道文章中图片的源属性呢?
到我们采集的文章编辑页面,点击文本格式,找到图片部分,可以看到,图片的实际地址是在data-src里面的,所以设置图片源属性的时候就要写成data-src