采集文章需要先获取文章的地址,通常我们打开的是栏目列表页面 下载此演示规则
phpcms后台---功能模块---采集器
采集匹配规则:前部分需要是唯一的。后面为紧跟着的匹配。
http://news.sina.com.cn/china/sz/index.html 打开这个页面向里面填入信息。
国内全部为要获取的区域前部分
某篇区域内获取列表:填入这个后,可以有效的获取列表代码段。可以排除列表外,如导航链接,相关新闻链接等。
往日新闻>>为列表结尾。
找到标题
保存,开始测试
文章添加时间可以是随机时间,也可以是按照当前时间进行添加。
发布后,
到该频道下面--管理文章
我们已经采集到了。不过现在文章还没有生成静态。需要生成下。
进入发布网页 可指定生成的开始id和结尾id
最终效果如图。