金石極速網頁采集器專門采集和訂閱您自已指定的信息源網站,既可以采集指定網頁上的所有信息,也可以按關鍵詞匹配采集。您可以指定采集的線程數(shù),找到最高效的采集設置。
本軟件是市面上唯一一款能實現(xiàn)通過自定義欄目和關鍵詞來采集打造完全屬于您自已的桌面新聞系統(tǒng),新聞來源完全由您自行指定,運行線程數(shù)也可以自行設定。軟件會自動過濾網上的重復信息,并允許您自行設置相似度在多少以上的信息不再重復采集,讓您輕松掌控重要資訊。
金石極速網頁采集器使用說明
系統(tǒng)設置中的采集選項是為對軟件的采集行為進行個性化定制,點擊工具欄中的[系統(tǒng)設置]按鈕進去后,界面如下圖:
1.不采集標題與已有信息相似度達XX以上的:軟件會耗一定時間比對每條資訊與前面已采集的資訊相似度是否超過了該設定標準,超過標準的視為類同信息,不再重復采集。當該值設為98以上時,軟件不會再比對,省下了比對的時間,但可能出現(xiàn)類同資訊。因為當已采集信息量較大時,比對比較耗時,用戶可酌情選擇。
2.同一資訊匹配上不同關鍵詞時:可以只采集一條,也可以為不同的關鍵詞各采集一條。視各人喜好選擇。
3.訂閱采集線程數(shù)和關鍵詞采集線程數(shù): 您指定幾個線程系統(tǒng)就會生成幾個線程來采集,提高采集線程數(shù)能加快采集,但如果太高,可能導致系統(tǒng)生成線程有問題,反而使采集中斷。建議一般的電腦二者線程數(shù)之和不要超過20,線程數(shù)為0或負數(shù),系統(tǒng)將不進行該項采集工作。
4.信息時效:設置為10天時,軟件將只采集最近10天內發(fā)布的有效資訊,并在每一次啟動時自動刪除超過10天的資訊。(注:1天指24小內時的信息,而不是僅指當天信息)
5.關鍵詞匹配方式:可選“精準匹配”和“模糊匹配”,精準匹配要求采集的資訊必須包含完整的關鍵詞,而模糊匹配則允許采集只包含部分關鍵詞信息的資訊。為了避免采集到無關的信息,以設為精準匹配比較合適。
6.關鍵詞匹配范圍:可選“全文匹配”和“標題匹配”,對應于關鍵詞在全文范圍內匹配還是僅對標題匹配。
7.使用代理服務器:軟件允許您使用代理服務器訪問網絡,但您的代理服務器必須是確保可用的,可以匿名訪問的,否則軟件將不能采集網絡信息。
- PC官方版
- 安卓官方手機版
- IOS官方手機版