火车头采集器是一款游戏的采集软件,是目前使用人数最多的互联网数据抓取、处理、分析,挖掘软件。软件凭借其灵活 的配置与强大的性能领先国内数据采集类产品,软件操作也挺简单。软件从第一代到现在已经有十多年了,售后客服也算挺到位的。当然也可以用免费版,免费版的功能限制比较多。
1 采集软件
本次演示使用的是火车头9.5基础版。
2 网站cms
本次演示主要是使用火车采集器采集文章并发布到dede网站,dedecms也是一个比较流行的cms,虽然争议也比较多,但是这个CMS用起来很简单,二次开发也挺方便,对于一些站长来说,还是挺方便的。本次使用的是DedeCMS V5.7 SP2 UTF8正式版。
3 火车头配置
火车头默认数据保存方式是sqlite,建议更换成mysql。使用这种保存方式需要安装mysql数据库。可以去mysql官网下载安装,也可以下载集成安装包,如wamp,phpstudy,xampp。这些集成安装包都是包含apache,和php的,实际我们用到的只有mysql。保存方式选择Mysql,需要在软件中填写数据库配置信息。
4 其他软件
采集的数据有时候需要更改,如果有一个好的mysql管理软件就可以如虎添翼。在这里推荐navicat for mysql,这是一款国内公司开发的mysql管理软件,非常优秀。可惜的是收费挺贵,像我们学习用的话,下载早期的版本,比如10.1.7版本,也可以用。