如何添加dedecms类型网站采集功能?

《如何添加dedecms类型网站采集功能?》要点:
本文介绍了如何添加dedecms类型网站采集功能?,希望对您有用。如果有疑问,可以联系我们。

如何添加dedecms类型网站采集功能?请阅读下文.

1.登陆dedecms后台→采集——采集节点管理——增加新节点

如何添加dedecms类型网站采集功能?

2.比如我们采集的普通文章,我们选择普通文章,然后确定

如何添加dedecms类型网站采集功能?

3.进入了采集的设置页面,填写节点名称,就是给这个新节点取个名字,你可以任意填写,自己清楚就行.

如何添加dedecms类型网站采集功能?

4.打开想要采集的文章列表页.利用快捷键ctrl+U或者鼠标右键——查看源文件找到目标页面编码,就在charset后面)

如何添加dedecms类型网站采集功能?

5.填写列表网址获取规则看看文章栏目列表第一页的地址【比如http://www.123.com/xinwenzixun/list_2_2.html和http://www.123.com/xinwenzixun/list_2_3.html】

6.从这里可以发现list_2_后面的数字不一样,其他的都一样,所以我们可以这样写http://www.123.com/xinwenzixun/list_2_(*).html就是把1换成了(*)因为这里只有2页,所以我们就填从1到2每页递增当然是1了,2-1...是等于1吧

如何添加dedecms类型网站采集功能?

7.填写文章网址匹配规则了,回到文章页、CTRL+U快捷键或者鼠标右键查看源文件找到文章列表页区域开始的HTML,就是找开始的标志.如图,在用ctrl+F快捷键,查看是否是整篇文章中唯一的开始标签.同理,我们可以找到文章结束的标签.

a.文章列表页内容开始标签

如何添加dedecms类型网站采集功能?

a.文章列表页内容结束标签

如何添加dedecms类型网站采集功能?

8.根据上面找出的开始标签以及结束标签,写着下面对应的方框中,然后点击保留并且测试按钮,你会发现单纯这样文章内容是不能采集的,所以我们还需要接着往下浏览.

如何添加dedecms类型网站采集功能?

9.点击最上面的【内容配置】根据你需要的填写对应的内容

如何添加dedecms类型网站采集功能?

10.比如采集相关文章的标题,我们可以利用键盘快捷键CTRL+U或者鼠标右键查看源代码,找到文章的标题,在利用ctrl+F快捷键查看是否是唯一的一个代码标签,如果是,就添加在对应的方框里面,如果不是,在查找附近的,直到唯一的标签为止.

如何添加dedecms类型网站采集功能?

11.同理,添加内容的开始标签以及结束标签.值得提示的是,我们在采集别人网站文章的时候,有时候是需要过滤掉别人的信息的,这个时候 可以点击【过滤规则】最右边的常用规则.

如何添加dedecms类型网站采集功能?

12.具体的图片在下面,根据具体的情况来选择,点击确定就可以了,当然我们在最后的时候还需要点击【保留并且测试】,这样才可以保留采集规则.

如何添加dedecms类型网站采集功能?

欢迎参与《如何添加dedecms类型网站采集功能?》讨论,分享您的想法,编程之家PHP学院为您提供专业教程。

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


1、想好字段名! 这里取一个test 商品发布模板:post_trade.htm 在商品发布模板贴内新建一个文本框!
一、后台 → 全局 → 关闭站点(为了不影响数据库备份) 二、数据备份
<?php /** [Discuz!] (C) 2001-2099 Comsenz Inc. config_global.php Build at 2012-07-06 10:16:22 */
今天给大家讲讲 如何把已经切割好的html页面或者模仿的页面转换成可供DIY的页面
打开网站根目录下/template/default/common header_common.htm文件找到 <title><!--{if !empty($navtitle)}-->$navtitle - <!--{/if}--><!--{if empty($nobbname)}--> $_G['se
打开网站根目录/source/module/portal/portal_list.php搜 category_get_list 在里面加入以下代码:添加一下代码
请问discuz的右侧工具栏(有回到顶部,返回板块),但是我想再添加点东西,可是我百度了,也从源码里找了好久,都没找到解决方法,请问可以教一下吗?
这里建议直接使用163邮箱,因为 我测试了 qq邮箱,yeah邮箱 均不能用。 第一步 去163注册一个邮箱,具体怎么注册 想必大家都会。注册好进入163 看下图
这些天百度和google了不知道多少遍,发现discuz的官方文档和二次开发资料少得可怜。调用个编辑器这样采用的功能官方文档居然没有,网友的分享多少也有些不完整;中途差点放弃。最后实在没办法兼不甘心,自己啃源码去
UPDATE `表名称` SET `click` = click+ROUND(RAND() * 6666+ 666) WHERE `click` <5000 复制代码
discuz在数据库批量更新(替换)板块id(fid/gid) UPDATE `fx_forum_thread` SET `fid` = replace(fid,'2','52') WHERE `fid` =2
想在自己的写上置顶的帖子    <div class="announcement_con"> <ul>
进入网站目录:/source/include/post 找到:post_newthread.php备份:post_newthread.php编辑:post_newthread.php搜索:
C::t('forum_attachment')->fetch_all_by_id('aid',$v['tid'] ); 执行上面的代码,会返回对应帖子的附件信息!
版本 dx 3.3 估计3.4一样有这个问题,ie内核的浏览器下在上传后,缩略图都是显示xx。这个问题主要还是https下,对图片输出的时候 不能使用
论坛人气弱?想改阅读数的站长可以围观! 找到:source/module/forum/forum_viewthread.php文件搜索代码:
<!--{if $allowpostreply && !$_G['forum_thread']['archiveid']}--> <a id="post_reply" onclick="showWindow('reply','forum.php?mod=post
SQL语句 UPDATE 表名称 SET 字段名 = REPLACE( 字段名,  '旧字符串',  '新的字符串' )
discuz 帖子内容页面的,上一篇,下一篇代码 上一篇: <a href="forum.php?mod=redirect&goto=nextoldset&tid=$_G[tid]" title="{lang last_thread}"><img src=&quo
1.php文件内判断 if(!$_G['uid']) {                         showmessage('to_login','',arra