站长利刃?ET采集器之采集篇(上)

2011-12-25 2901点热度 0人点赞 0条评论

喜欢看文章?

怕有弹窗?

简单,ET可以帮你解决。

从百度随便搜索一个网址(http://www.jpww8.com/)

这个网址也是我们的目标网站

打开ET采集器,在菜单栏中找到采集配置→右键“添加规则”

给规则定义一个名字,最好是网站标题加分类标题,这样容易记

点击查看原图

 

图中所划横线,在下面都会讲到

1、列表网址

是指采集的列表页,我们采集的是“爱情文章”,则网址为http://www.jpww8.com/love/list_1_2.html

而不是http://www.jpww8.com/love/

其实http://www.jpww8.com/love/就是http://www.jpww8.com/love/list_1_1.html

2、自动列表网址

如果列表不止一页,这样就必须用到自动列表

观察“爱情文章”的第一、二、三页

http://www.jpww8.com/love/list_1_1.html

http://www.jpww8.com/love/list_1_2.html

http://www.jpww8.com/love/list_1_3.html

可以得到这三页的规律n=n+1

点击查看原图

<%listid%>这个就是ET里面的变量值(只使用此选项),直接点击“列表编号”就可以出现

后面的2→2意思是第二页到第二页

步长1,就是n=n+1中的1,也就是常量。

如果这个规律是n=n+2,则步长为2

启用自动列表,在其前面方框勾选即可,如果启用则上面的列表网址无效。

3、列表区域

点击查看原图

红色区域则为列表区域

开始写列表区域的规则,看下面步骤之前先看https://www.234du.com/post-56.html

列表太长,分两部截图。

 

点击查看原图

 

点击查看原图

 

列表规则写法:

点击查看原图

<%content%>区域标记

写好规则后点击锤子形图片进行检验,ET里所有检验图标都是锤形

 

4、列表分析规则

点击查看原图

 

点击查看原图

<%fileid%>文章地址变量

<%title%>标题变量

<%var%>变量标记(对一些无用的代码进行变量)

<%litpic%>缩略图变量

 

点击查看原图

 

5、文章聚合网址

这一步是依据上面的文章测试结果

第四步测试结果是一个完整的网址,聚合一栏中填入<%fileid%>既可

点击查看原图

如果:

测试结果为

1、

/love/qingganwenzhang/2011/1216/19303.html  则聚合规则为:http://www.jpww8.com<%fileid%>

 

2、/qingganwenzhang/2011/1216/19303.html  则聚合规则为http://www.jpww8.com/love<%fileid%>

 

3、love/qingganwenzhang/2011/1216/19303.html  则聚合规则:http://www.jpww8.com/<%fileid%>(和1的差别在“/”)

 

其余类推就可以了。

 

第一次写这么长的文章,累死了……

 

 

六度

这个人很懒,什么都没留下

文章评论