快速的采集一些網(wǎng)頁(yè)上面的信息,你總是需要各種各樣的軟件的,本站現(xiàn)在就可以免費(fèi)的為你帶來(lái)下面的這款最新的內(nèi)容采集與信息發(fā)布的數(shù)據(jù)處理軟件--杰靈網(wǎng)頁(yè)采集器!
杰靈網(wǎng)頁(yè)采集器特點(diǎn)
1:支持手動(dòng)單頁(yè)模式,指定URL采集內(nèi)容,采集內(nèi)容可在編輯器里排版修改。
2:支持從列表頁(yè)提取網(wǎng)址后再采集,可提取列表頁(yè)相關(guān)內(nèi)容。
3:支持從內(nèi)容頁(yè)衍生的(無(wú)限)多級(jí)頁(yè)面抓取(多級(jí)頁(yè)支持分頁(yè))
4:支持多任務(wù)多線程同時(shí)采集不同目標(biāo)網(wǎng)頁(yè)信息
5:支持自定義COOKIE、UserAgent等Header頭信息。
6:采集每個(gè)字段內(nèi)容,可關(guān)聯(lián)組合字段內(nèi)容,可選擇多種字符串后處理方式
7:支持圖片本地化,添加LOGO水印,支持圖片本地化命名格式
8:自帶數(shù)據(jù)庫(kù)簡(jiǎn)易查看數(shù)據(jù)功能
9:關(guān)鍵詞自動(dòng)分詞
10:同義詞替換,可自定義同義詞詞庫(kù)
11:關(guān)鍵詞內(nèi)鏈功能,可自定義關(guān)鍵詞詞庫(kù)
杰靈網(wǎng)頁(yè)采集器常見(jiàn)問(wèn)題
網(wǎng)頁(yè)亂碼怎么辦?
在設(shè)置里選擇相應(yīng)的網(wǎng)頁(yè)編碼。
如何添加任務(wù)?
點(diǎn)擊任務(wù)欄,右鍵選擇菜單。
如何發(fā)布到dedecms?
將軟件內(nèi)的發(fā)布接口下的dedecms接口放到網(wǎng)站子目dede下即可
杰靈網(wǎng)頁(yè)采集器更新日志
1、內(nèi)容提取支持最多10級(jí)【參數(shù)】循環(huán)提取,適合(論壇問(wèn)答回復(fù)采集頭像,用戶名,發(fā)布時(shí)間,及內(nèi)容)
2、增加關(guān)鍵詞自動(dòng)分詞
3、增加同義詞替換,可自定義同義詞詞庫(kù)
4、增加關(guān)鍵詞內(nèi)鏈功能,可自定義關(guān)鍵詞詞庫(kù),可限定替換頻率。 (并可解決帝國(guó)IMG,A元素嵌套替換的BUG)
5、增加計(jì)劃任務(wù)功能
6、下載附件支持帶COOKIE登陸下載
7、發(fā)布規(guī)則 支持使用 全局標(biāo)簽函數(shù) 如帝國(guó)目錄newspath 可使用{dd:日期yyyymmdd}
8、增強(qiáng)規(guī)則導(dǎo)入導(dǎo)出功能。
9、增加PHP腳本擴(kuò)展(測(cè)試中)
10、可指定單次采集內(nèi)容網(wǎng)址最大數(shù)
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版