1、设置采集站点名称:
------采集站点名称为助记名称,你可以任意填写,
-----但要写得清楚明朗,使人一看就明白从哪里采集的
2、设置采集站地址:
-----要正确填写你要采集站点的URL网址。
-----如要采集动网新闻系统里的文章,那么这里就设置http://news.dvbbs.net/,注意一定要带“/”
3、设置采集列表页地址:
-----输入你要采集的有文章标题列表的页面的URL网址。
-----如要采集这一页“文章标题”下25篇文章,采集列表页地址就一定填:
-----http://news.dvbbs.net/infoList/Catalog_6_1.html
4、设置采集分类:
-----采集分类是归类名称,你可以任意填写
5、设置采集到:
-----目前只要填写前两项,即:频道ID和栏目ID
-----选LZ8_Article表示采集到的内容入文章版块的栏目(栏目编号为你所填写的ClassID)中
-----选LZ8_News表示采集到的内容入新闻版块的栏目(栏目编号为你所填写的ClassID)中
6、设置列表开始/结束字符:(这个比较关键,要查看“列表页”原代码)
-----就是要将要采集的列表的位置确定下来,缩小采集范围
-----如要采集刚才提到的DV的25篇文章,
-----列表开始字符:就是第一条(“全正则的检测IP是否合法的函数”)前的部分字符
-----列表结束字符:就是最后一条(“MD5算法研究(2)”)后的部分字符
7、设置列表URL开始/结束字符(这个也比较关键,要查看“列表页”原代码)
------将标题的所转向页面的URL地址用“列表URL开始字符”和“列表URL结束字符”确定下来,
------如“自動化檢查 IIS 5.0 的安全漏洞“是<a href="../infoview/Article_2921.html">
------则“列表URL开始字符”是 href="../
------则“列表URL结束字符”是 "> ,这样就把URL确定下来了
------”自動化檢查 IIS 5.0 的安全漏洞“ 内容页URL地址就是
-------”采集站地址(http://news.dvbbs.net/)+(infoview/Article_2921.html)“
8、设置标题开始/结束字符 (这个也比较关键,要查看“内容页”的原代码)
------随便打开一个内容页如(http://news.dvbbs.net/infoview/Article_2921.html)
------用“标题字符”和“标题结束字符”将标题确定下来
9、设置内容开始/结束字符 (这个也比较关键,要查看“内容页”的原代码)
------仍旧在这一页(http://news.dvbbs.net/infoview/Article_2921.html)
------用“内容开始/字符”和“内容结束字符”将标题确定下来
10、其他的几项,从"列表开始字符"到"文章关键字",都是一样设置
------最后按”设置”按纽保存。设置完毕
==================================================================
第二部分就开始采集
-----只要你按“开始采集”按纽就可以了,转到一些采集常数的页面,
-----你可以默认,这样采集完成后的数据就到了采集数据库(Collect.mdb)。
-----你还要点击“处理采集数据-》入采集库xxx”入库。
------如果选“马上入库(不入采集库)”则数据直接进入了你所设置的文章(LZ8_Article)或新闻(LZ8_News)数据表中了
------你可以打开“文章管理-》管理”或“新闻管理-》管理”查看,一定在里面。
第三部分就开始采集(不说了,自动进行。)
===================================================
文本教程下载:
点击浏览该文件
教程视频教程下载:
当你看到下面的LOGO的时候,就表明可以下载
=============================
================================
录像的完整包下载地址:点这里下载 大小:63M
下面是分段压缩的下载地址:
段一:点这里下载 大小:12M
段二:点这里下载 大小:11M
段三:点这里下载 大小:17M
段四:点这里下载 大小:21M
==================================================