前几天为大家介绍了用,,那今天我们就来和大家一起分享用dedecms采集搜狐新闻的一些文章
方法还是一样,博主给出大家最源始的配置文件,需要的网友,只要复制下面的配置文件,导入进去,再做相应的更改就可以啦
举例说明:如果要采集http://sports.sohu.com/s2010/icehockey2010/这个列表的新闻,那我们只需要把这下面的配置文件导入进去就ok.
{dede:listconfig}
{dede:noteinfo notename="搜狐采集" channel refurl="http://sports.sohu.com/20120724/n348901082.shtml" sourcelang="gb2312" cosort="asc"
isref="no" exptime="10" usemore="0" /}
{dede:listrule sourcetype="batch" rssurl="http://" regxurl="http://"
startnothas="" listpic="1" usemore="0"}
{dede:addurls}http://sports.sohu.com/s2010/icehockey2010/{/dede:addurls}
{dede:batchrule}{/dede:batchrule}
{dede:regxrule}{/dede:regxrule}
{dede:areastart}<div>
{/dede:areastart}
{dede:areaend}<div>{/dede:areaend}
{/dede:listrule}
{/dede:listconfig}
{dede:itemconfig}
{dede:sppage sptype='full' srul='1' erul='5'}{/dede:sppage}
{dede:previewurl}http://sports.sohu.com/20120312/n337466635.shtml{/dede:previewurl}
{dede:keywordtrim}搜狐{/dede:keywordtrim}
{dede:descriptiontrim}搜狐{/dede:descriptiontrim}
{dede:item field='title' value='' isunit='' isdown=''}
{dede:match}<title>[内容]</title>{/dede:match}
{dede:trim replace=""}-搜狐体育|_搜狐体育{/dede:trim}
{dede:function}{/dede:function}
{/dede:item}{dede:item field='writer' value='' isunit='' isdown=''}
{dede:match}{/dede:match}
{dede:function}{/dede:function}
{/dede:item}{dede:item field='source' value='' isunit='' isdown=''}
{dede:match}<span {dede:trim replace="胡鹏博客"}搜狐体育{/dede:trim}
{dede:function}{/dede:function}
{/dede:item}{dede:item field='pubdate' value='' isunit='' isdown=''}
{dede:match}<div>[内容]</div>{/dede:match}
{dede:function}{/dede:function}
{/dede:item}{dede:item field='body' value='' isunit='1' isdown='1'}
{dede:match}<!-- 正文 -->[内容]<!-- 分享 -->{/dede:match}
{dede:trim replace=""}<a([^>]*)>|</a>{/dede:trim}
{dede:trim replace=""}<script([^>]*)>(.*)</script>{/dede:trim}
{dede:trim replace="胡鹏博客"}搜狐体育{/dede:trim}
{dede:trim replace=""}此稿为新华社体育专线稿件,严禁转载。|此稿为新华社体育专线稿件|严禁转载{/dede:trim}
{dede:trim replace=""}<iframe([^>]*)>(.*)</iframe>{/dede:trim}
{dede:function}{/dede:function}
{/dede:item}
{/dede:itemconfig}
可以直接采集就会看到效果,如果不是你想要的,你就进入dedecms后台点采集->采集结点管理->导入配置然后修改 引用网址,手工指定网址,预览网址这三项就可以开始采集啦.也还可以更改其它.
版权声明: 本站资源均来自互联网或会员发布,如果侵犯了您的权益请与我们联系,我们将在24小时内删除!谢谢!
转载请注明: dedecms采集搜狐新闻的配置文件_复制即可使用