发布站开机广告采集的初始界面
下面我们来一一介绍私服采集的各个参数是代表什么意思,怎么设置才能达到自己的采集要求。
一、采集规则:您想要采集哪一个网站,直接选择即可。
二、广告日期:默认为空,当采集广告日期为空时则表示采集目标网站上面所有日期的开区信息。如不为空,例如我们选择一个日期,“2011-8-19”,如下图所示,则采集的广告信息仅为200-8-19日的开区信息。(提示:不允许输入多个日期,且日期格式为 yyyy-M-d,不推荐手动输入日期格式,直接选择日期即可。)
三、采集条数:默认为50,此项不能为空,只能输入大于零的整数。
四、关键词:默认为空,此项如果为空则表示不根据关键词采集,采集所有符合条件的开区信息,可以设置多个关键词,多个关键词用竖线“|”隔开,例如:中变|玉兔|合击,则当广告信息中包含中变,玉兔,合击任何一个词的时候,则该条广告信息被认定为符合要求。(提示:只要满足其中任何一个关键词,则该信息符合要求)
五、不允许重复的天数:默认为3,有的开区信息不止打一天的广告,如果不设置过滤重复信息的天数,会采集数据库中已有的数据,推荐天数设置为三天或者七天。
六、采集信息直接入库:默认已选中,勾选上此项则采集的信息直接可以在网站前台显示,如果不勾选,需要管理员审核之后才能在前台显示,状态为未审核。
提示:以上的各项参数之间的关系是并且的关系,不是或者。意思也就是某条信息需要满足所有条件才会被采集入库。
例如采集参数是这样的,采集的信息就是
8uu.com上面2011-8-19号的与1.76或者仿盛大相关的开区信息,且数据库中三天以内没有该条数据,信息才会被采集入库。
采集过程
重要提示:采集过程中不得关闭,刷新采集网页,程序采用的是延迟加载采集技术,所有不会导致浏览器假死的状态,采集过程中可以把浏览器最小化。
采集过程图解,采集的速度是根据你的网速决定的。
如果采集超时或者远程网站打不开会出现这样的提示页面,此时表示采集失败,请另选一个网站进行采集。
如果远程网站访问成功则显示如下界面
当显示本页面的时候,表示本次采集已结束
40Ps.Com 专业发布站提供商, 强大而且简单的游戏采集功能
本站纯属技术研究,如有侵权请来信通知我们,我们将在第一时间进行删除处理。 gainiansoft@qq.com