点击进入知科官方网站
查看: 1230  |  回复: 12
 
 
aolemei
积分:1060
注册时间:2012-01-10
最后登录:2014-08-12
发送短消息
发表于 2012-05-24 13:03
新闻采集功能,总无法采集到数据,各参数设置正确确保没有问题,但每次总是显示“共采集了0条,目前新闻数据表共有291条信息!
 
 
 
 
Official服务
积分:16745
注册时间:2012-01-02
最后登录:2015-09-24
发送短消息
回复于 2012-05-24 13:05
1楼
采集规则有问题,请修正采集规则!
 
 
 
aolemei
积分:1060
注册时间:2012-01-10
最后登录:2014-08-12
发送短消息
回复于 2012-05-24 13:12
2楼
采集规则都已经改完了,我也确认没有问题?怎么 总是能查到但采集不下来呢?
 
 
Official服务
积分:16745
注册时间:2012-01-02
最后登录:2015-09-24
发送短消息
回复于 2012-05-24 13:15
3楼

这个无法为您具体解答,请仔细排查!

 

 

 
 
Official服务
积分:16745
注册时间:2012-01-02
最后登录:2015-09-24
发送短消息
回复于 2012-05-24 13:16
4楼
注意起始标签代码
 
 
aolemei
积分:1060
注册时间:2012-01-10
最后登录:2014-08-12
发送短消息
回复于 2012-05-24 13:23
5楼
列表页起始字符: <ul class="list_009">
列表页结束字符: <div class="hs01"></div>
内容页网址前缀:
列表链接中包含: 2012-05-24
列表接中排除:  
   
标题: <title>{$}_新闻中心_新浪网<title>
时间: {$}
内容: <div class="blkContainerSblkCon" id="artibody">{$}<div  style="margin-right: 0px; margin-left: 0pt; padding-right: 0px;" class="blkComment otherContent_01"><style>
   
 
 
Official服务
积分:16745
注册时间:2012-01-02
最后登录:2015-09-24
发送短消息
回复于 2012-05-24 13:24
6楼
把采集规则上传在这里
 
 
aolemei
积分:1060
注册时间:2012-01-10
最后登录:2014-08-12
发送短消息
回复于 2012-05-24 13:25
7楼
下面是我的参数配置,我检查了几遍感觉没啥问题呀?麻烦你给看下 我这里那里配置的不对?谢谢!
 
采集规则名称:新浪新闻采集 
网址:  http://roll.news.sina.com.cn/news/gnxw/gdxw1/index_2.shtml
列表页起始字符:<ul class="list_009"> 
列表页结束字符:<div class="hs01"></div> 
内容页网址前缀:http://news.sina.com.cn/c/2012-05-24/ 
列表链接中包含:2012-05-24 
列表链接中排除: 
   
标题: <title>{$}_新闻中心_新浪网<title>
时间: 
内容: <div class="blkContainerSblkCon" id="artibody">{$}<div  style="margin-right: 0px; margin-left: 0pt; padding-right: 0px;" class="blkComment otherContent_01"><style>
 
 
 
 
 
Official服务
积分:16745
注册时间:2012-01-02
最后登录:2015-09-24
发送短消息
回复于 2012-05-24 13:32
8楼

上传采集规则在这里,采集规则目录是:

 

 
 
aolemei
积分:1060
注册时间:2012-01-10
最后登录:2014-08-12
发送短消息
回复于 2012-05-24 14:08
9楼
aHR0cDovL3JvbGwubmV3cy5zaW5hLmNvbS5jbi9uZXdzL2dueHcvZ2R4dzEvaW5kZXhfMi5zaHRtbOefpeenkemHh+mbhuWIhumalOespuWPtzx1bCBjbGFzcz0ibGlzdF8wMDkiPg0K55+l56eR6YeH6ZuG5YiG6ZqU56ym5Y+3PGRpdiBjbGFzcz0iaHMwMSI+PC9kaXY+DQrnn6Xnp5Hph4fpm4bliIbpmpTnrKblj7dodHRwOi8vbmV3cy5zaW5hLmNvbS5jbi9jLzIwMTItMDUtMjQv55+l56eR6YeH6ZuG5YiG6ZqU56ym5Y+3MjAxMi0wNS0yNOefpeenkemHh+mbhuWIhumalOespuWPt+efpeenkemHh+mbhuWIhumalOespuWPtzx0aXRsZT57JH1f5paw6Ze75Lit5b+DX+aWsOa1que9kTx0aXRsZT7nn6Xnp5Hph4fpm4bliIbpmpTnrKblj7fnn6Xnp5Hph4fpm4bliIbpmpTnrKblj7c8ZGl2IGNsYXNzPSJibGtDb250YWluZXJTYmxrQ29uIiBpZD0iYXJ0aWJvZHkiPnskfTxkaXYgIHN0eWxlPSJtYXJnaW4tcmlnaHQ6IDBweDsgbWFyZ2luLWxlZnQ6IDBwdDsgcGFkZGluZy1yaWdodDogMHB4OyIgY2xhc3M9ImJsa0NvbW1lbnQgb3RoZXJDb250ZW50XzAxIj48c3R5bGU+55+l56eR6YeH6ZuG5YiG6ZqU56ym5Y+3OOefpeenkemHh+mbhuWIhumalOespuWPt+efpeenkemHh+mbhuWIhumalOespuWPt+efpeenkemHh+mbhuWIhumalOespuWPt+efpeenkemHh+mbhuWIhumalOespuWPt+efpeenkemHh+mbhuWIhumalOespuWPtw==
 
 
aolemei
积分:1060
注册时间:2012-01-10
最后登录:2014-08-12
发送短消息
回复于 2012-05-24 14:11
10楼
这个就是对应这个采集规则的TXT文档里的信息,麻烦有空忙我看下,什么地方配置的不对?
 
 
Official服务
积分:16745
注册时间:2012-01-02
最后登录:2015-09-24
发送短消息
回复于 2012-05-24 16:06
11楼
刚对你的采集规则修改了一下,采集规则文件下载地址是http://demo4.hbzkwl.com/s/plus/zkcms_caiji_news/rules/a.txt
 
 
如何使用这个采集规则文件请参阅http://demo4.hbzkwl.com/bbs/79.htm
 
 
ny0127
积分:295
注册时间:2012-05-15
最后登录:2012-10-09
发送短消息
回复于 2012-05-24 16:27
12楼
 吧那个 2012-05-24改成/201试下
回复帖子