火车采集器不光是采集功能强大,数据发布功能也挺方便。可以把采集数据发布到不同类型的网站,论坛,博客,门户站都可以。
本次演示发布文章到dedecms网站上。数据我们采集chinaz.com上的建站栏目,该栏目下有三个子栏目。
以下是操作步骤:
1.在dedecms网站新建这四个栏目,我们可以看到这四个栏目的分类ID,子栏目的分类ID分别是2,3,4。
2.火车头采集规则设置
因为dede网站数据库里面的分类ID,我们采集下来的是字符。这样直接发布是不行的。需要把分类替换成ID。
还有一种方法,如果一条任务只采集了一个分类下的文章,可以不用替换分类ID,在发布模块里面选择分类ID。
本次演示的文章有图片,所以我们还需要设置图片路径。在其他设置-》文件图片下载 里面文件链接地址前缀填写’/’,这样可以保证图片地址是绝对路径。
3. 配置发布规则
(1). 双击任务,选择内容发布规则,选择Web在线发布。点击添加配置,选择发布模块。
(2). 双击选中模块,编辑内容。
a.修改 网站自动登陆,获取栏目列表,网站发布参数里面的后台地址,改成自己的后台地址。
b. 修改发布post数据里面的表单值,改成和采集规则对应的。可以从右侧标签里面选择。修改完成后,保存发布模块。
如果没有采集封面图,可以不填。
(3). 配置发布模块:
选择网站编码,填写网站地址。
选择登陆方式。因为发布的时候需要登陆后台。我们选用内置浏览器登陆,数据包登陆需要远程mysql权限,不登录太不安全。
启动浏览器获取登陆信息,在内置微型浏览器中输入后台地址,并且登陆成功后,就关闭掉浏览器。
现在配置已经获取到了cookie.
因为我们是一条任务采集了多个分类,在这里不用选择分类,如果是一个任务采集一个分类,这里需要选择分类。
填写完成后,保存配置名,模块配置完成。
4.其他规则,图片上传。
我们采集的内容里面包含图片,发布的时候也需要连同图片一起上传。
选择其他设置->Ftp/SFtp文件上传,选择FTP上传和SSH上传模式均可,填写好相关配置以及网站上传根目录就可以了。
5.开始发布。
最终效果