網(wǎng)頁信息收集器是一款綠色小巧,功能實用的
網(wǎng)頁信息采集軟件。Internet上有著極其龐大的資源信息,各行各業(yè)的信息無所不有,網(wǎng)頁信息收集器可以很方便的針對某個網(wǎng)站的信息內(nèi)容進行收集。如某個論壇的所有注冊會員的E-MAIL列表、某個行業(yè)網(wǎng)站的企業(yè)名錄、某個下載網(wǎng)站上所有軟件列表等等。操作簡單方便,更容易為普通用戶所掌握,有需求的用戶不妨下載體驗!

功能特色
1、執(zhí)行任務(wù)
根據(jù)已建立的任務(wù)信息保存、提取網(wǎng)頁,也可通過“雙擊”某項任務(wù)啟動此功能

2、新建、復制、修改、刪除任務(wù)
新建、復制、修改、刪除任務(wù)信息

3、默認選項
設(shè)置默認工作路徑(默認為當前程序目錄下的WorkDir文件夾)
設(shè)置默認提取測試數(shù) (默認為10)
設(shè)置默認文本分隔符 (默認為 *)

4、新建、編輯任務(wù)信息
任務(wù)名稱:在默認的工作文件夾下生成以此命名的文件夾。
登錄地址:針對某些需要登錄才能查看其網(wǎng)頁內(nèi)容的網(wǎng)站,填寫登錄頁面地址。在執(zhí)行任務(wù)時,軟件會打開此登錄頁面讓您登錄該網(wǎng)站
序數(shù)格式類型網(wǎng)頁、非序數(shù)格式類型網(wǎng):
這里的序數(shù)格式、非序數(shù)格式主要是指提取地址是否僅僅是數(shù)字的變化。例如類似于:
①http://xxx.com/1.html 和 http://xxx.com/2.html 就屬于序數(shù)格式
②http://xxx.com/abc.html 和 http://xxx.com/def.html 則屬于非序數(shù)格式
列表地址:在類型為“非序數(shù)格式類型網(wǎng)”時,第一頁列表的鏈接地址
提取地址:由實際保存的網(wǎng)頁地址共同部分 + * 號組成。
例如要提取:
①http://xxx.com/1.html 和 http://xxx.com/2.html 則提取地址為 http://xxx.com/*.html
②http://abc.xxx.com/abc.html 和 http://test.xxx.com/def.html 則提取地址為 http://*.xxx.com/*.html
翻頁地址:為列表網(wǎng)頁上的“下一頁”鏈接地址,將其中變化的部分用 * 號代替。
頁數(shù)起始:要開始提取的頁數(shù)
頁數(shù)截止:要停止提取的頁數(shù)
當前頁數(shù):當前已經(jīng)提取到的頁數(shù)
已保存網(wǎng)頁數(shù):已經(jīng)保存的網(wǎng)頁數(shù)
任務(wù)詳細描述:該任務(wù)的詳細描述信息
網(wǎng)友評論