xdaza网站其实已经存在三年了,但是期间不停的更换域名和服务器,丢失了很多本就不多的文章,后来也想专门开辟一个栏目,来更新科技资讯,但是手动更新显然不现实,于是我就想到了采集。


火车头采集器使用教程

本教程使用火车头V9(又名高铁采集器)版本,网站为wordpress5.x版本。

网站服务器环境使用的宝塔面板,服务器系统是centos7,windows系统跟linux一样的操作原理思路,不必纠结用什么系统。

本教程将按照做一个wordpress采集站的过程步骤来写教程,内容基本都是基础知识。

怎么搭建wp采集站之火车头采集教程汇总
怎么搭建wp采集站之火车头采集教程汇总

关于采集内容

网站大量采集的话相比手打原创内容更难收录,但是优点是显而易见的。手打怎么也不可能日更数千篇文章甚至上万篇。我这个网站大多数是自己写的,也有直接手动复制粘贴的。更新了几年也还不到一千篇。

看自己的考虑了,这里只是废话一下提个醒。

采集的内容一定要版面整洁,不要乱糟糟的一大篇,那样没什么意义。采集之前先把网站的基础框架设计好!

 

其他说明
本教程李关于采集发布设置做了简化处理,没有采集图片,发布设置仅仅发布标题和内容。未设置时间、作者、标签等。教程后面我会单独开文章写这些。这里仅以最简化的步骤来进行。
接口文件没有区别,都是这一个。


需要先下载这些东西:

接口文件:火车头WP发布接口

发布模块(教程使用):火车头WP发布模块(仅标题内容)

发布模块:wordpress.post.quantao.wpm

采集器这里就不放了,之前博客发了破解版被官方投诉了。


教程目录

火车头采集器教程:wordpress5.x发布接口介绍

 

火车头采集器发布模块直接放到火车头采集器程序一下目录内即可,这一步不需要做其他设置,所以这个就不写教程了

放到\Module\这个目录内

火车头采集器教程:怎么寻找目标网站?

火车头采集器教程:批量添加目标网站列表链接

火车头采集器教程:分析目标网站文章链接位置及规则

火车头采集器教程:分析目标网站要采集内容的位置及规则

火车头采集器教程:采集内容发布规则设置

火车头采集器教程:测试采集和发布是否正常


下面是一些特殊教程文章

火车头采集器图片采集上传设置

火车头采集器采集发布文章作者、时间、标签等内容

火车头采集器定时采集更新网站内容(长期做站必用)

火车头采集今日头条文章的教程


扩展阅读

[b2_insert_post id="1098"]


叽里咕噜~叽里咕噜~我又要去打杂啦づ ̄3 ̄)づ╭❤~