假如你采集了很多郵箱、淘寶買家?guī)ぬ、QQ帳號,或其它類似的帳號、ID等信息,但里面有很多重復(fù)的數(shù)據(jù),手工去除那太慢太煩容易出錯,這時候就可以使用重復(fù)數(shù)據(jù)過濾神器來過濾重復(fù)的數(shù)據(jù)。本軟件支持字符串過濾,也支持對.csv文件直接過濾。
重復(fù)數(shù)據(jù)過濾神器功能特點(diǎn)
1、支持多文件批量過濾,支持多線程過濾,以列表方式友好顯示每個文件各自的過濾進(jìn)度。
2、支持多文件合并過濾,如果你將數(shù)據(jù)保存在了多個文件中,不必合并,可以直接對這幾個文件進(jìn)行合并及去重復(fù)過濾,最后保存為一個無重復(fù)數(shù)據(jù)的文件。
3、每個文件過濾都會提供過濾報告,記錄各個數(shù)據(jù)的重復(fù)次數(shù),你可以再次按重復(fù)次數(shù)來篩選數(shù)據(jù)(比如在提取的淘寶交易訂單信息中,如果某個買家?guī)ぬ柍霈F(xiàn)的重復(fù)次數(shù)高于某個值,我們可以認(rèn)為它可能是刷信譽(yù)的買家而非真買家從而再次去除等)。
4、本軟件主要針對QQ號、旺旺號、郵箱、手機(jī)等任何你想去除重復(fù)的字符串?dāng)?shù)據(jù)。
重復(fù)數(shù)據(jù)過濾神器功能說明
1、字符串過濾
去除重復(fù)字串(只保留一次),過濾時一行一個字符串(字符串如帳號、ID等)。
將要過濾的字符串填寫到下面的文本框中,每行一個;也可以點(diǎn)擊【導(dǎo)入文本】按鈕從文件導(dǎo)入數(shù)據(jù)(如果導(dǎo)入的數(shù)據(jù)有亂碼,將原文用記事本打開并另存,將編碼改為ANSI)。
2、csv文件數(shù)據(jù)過濾
直接去除csv數(shù)據(jù)中的重復(fù)數(shù)據(jù)。
要對csv進(jìn)行過濾時,需要先指定以哪一個列作為過濾基準(zhǔn),即,如果不同行中的該列數(shù)據(jù)一樣時,表示二個行是相同的,那么將只保留最前面的那一行,后面的行將被忽略。設(shè)置好后,選擇過濾后產(chǎn)生的新文件要保存的位置,點(diǎn)擊“開始過濾”即可完成csv文件的數(shù)據(jù)過濾。
重復(fù)數(shù)據(jù)過濾神器更新內(nèi)容
1、字符串過濾增加行數(shù)顯示,增加過濾進(jìn)度
2、增加txt文件過濾,批量多個文件多線程同時過濾,支持各自過濾進(jìn)度的顯示;增加將多個txt文件合并過濾成一個文件。
3、Csv文件過濾增加批量多個文件多線程同時過濾,支持各自過濾進(jìn)度的顯示;增加將多個csv文件合并過濾成一個文件。
4、增加過濾報告,顯示重復(fù)數(shù)據(jù)的重復(fù)次數(shù)等。
5、本版開始成為共享軟件,未激活也能使用,但有限制:字符串過濾不得大于1萬行,txt、csv文件過濾時文件大小不得大于1M,不得同時過濾3個或以上的文件。
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版