喜欢看文章?
怕有弹窗?
简单,ET可以帮你解决。
从百度随便搜索一个网址(http://www.jpww8.com/)
这个网址也是我们的目标网站
打开ET采集器,在菜单栏中找到采集配置→右键“添加规则”
给规则定义一个名字,最好是网站标题加分类标题,这样容易记
图中所划横线,在下面都会讲到
1、列表网址
是指采集的列表页,我们采集的是“爱情文章”,则网址为http://www.jpww8.com/love/list_1_2.html
而不是http://www.jpww8.com/love/
其实http://www.jpww8.com/love/就是http://www.jpww8.com/love/list_1_1.html
2、自动列表网址
如果列表不止一页,这样就必须用到自动列表
观察“爱情文章”的第一、二、三页
http://www.jpww8.com/love/list_1_1.html
http://www.jpww8.com/love/list_1_2.html
http://www.jpww8.com/love/list_1_3.html
可以得到这三页的规律n=n+1
<%listid%>这个就是ET里面的变量值(只使用此选项),直接点击“列表编号”就可以出现
后面的2→2意思是第二页到第二页
步长1,就是n=n+1中的1,也就是常量。
如果这个规律是n=n+2,则步长为2
启用自动列表,在其前面方框勾选即可,如果启用则上面的列表网址无效。
3、列表区域
红色区域则为列表区域
开始写列表区域的规则,看下面步骤之前先看https://www.234du.com/post-56.html
列表太长,分两部截图。
列表规则写法:
<%content%>区域标记
写好规则后点击锤子形图片进行检验,ET里所有检验图标都是锤形
4、列表分析规则
<%fileid%>文章地址变量
<%title%>标题变量
<%var%>变量标记(对一些无用的代码进行变量)
<%litpic%>缩略图变量
5、文章聚合网址
这一步是依据上面的文章测试结果
第四步测试结果是一个完整的网址,聚合一栏中填入<%fileid%>既可
如果:
测试结果为
1、
/love/qingganwenzhang/2011/1216/19303.html 则聚合规则为:http://www.jpww8.com<%fileid%>
2、/qingganwenzhang/2011/1216/19303.html 则聚合规则为http://www.jpww8.com/love<%fileid%>
3、love/qingganwenzhang/2011/1216/19303.html 则聚合规则:http://www.jpww8.com/<%fileid%>(和1的差别在“/”)
其余类推就可以了。
第一次写这么长的文章,累死了……
文章评论