給大家介紹一款ROST新聞分析工具,采集多個搜索引擎的網(wǎng)頁和新聞,分詞和詞性分析,構(gòu)建語義網(wǎng)絡(luò),對采集回來的網(wǎng)頁進(jìn)行統(tǒng)計,存放于MDB庫中,并可自由導(dǎo)出,免費。
功能說明:
采集多個信息源網(wǎng)絡(luò)數(shù)據(jù),并格式化保存。
分詞和詞性分析
詞頻統(tǒng)計
詞語過濾
人名、地名、團(tuán)體機(jī)構(gòu)名提取
構(gòu)建語義網(wǎng)絡(luò)
數(shù)據(jù)可視化分析
特定數(shù)據(jù)來源總體概況
存放于MDB庫中,并可自由導(dǎo)出
軟件操作:
程序運行:程序下載到本地電腦后解壓文件,依次點擊文件ROST NAT→ROST NewsAnalysis Tools.exe
1、查看新聞:鼠標(biāo)可直接單擊輸出文件文本框打開.txt文檔經(jīng)行瀏覽,或選擇摘要文件、鏈接文件、域名文件瀏覽。
2、詞性識別與詞性統(tǒng)計:對文本文件里的詞進(jìn)行詞性判斷,如名詞,動詞等;以及統(tǒng)計文本文件里詞語出現(xiàn)的頻率。
3、社會網(wǎng)絡(luò)與語義網(wǎng)絡(luò)分析:過濾無意義詞組,統(tǒng)計文本文件中的詞出現(xiàn)最多次數(shù),分析每行文字中相關(guān)聯(lián)的詞組,用網(wǎng)狀形式展現(xiàn)出他們之間的關(guān)系。
4、統(tǒng)計圖:根據(jù)采集到新聞,按時間段統(tǒng)計這段時間新聞條數(shù),統(tǒng)計圖功能只限百度網(wǎng)頁、百度新聞、奇虎論壇使用,其它網(wǎng)站論壇在搜索時無時間顯示,故不能統(tǒng)計。
5、新聞匯總數(shù)據(jù):根據(jù)所輸關(guān)鍵詞,自動統(tǒng)計網(wǎng)頁相關(guān)結(jié)果數(shù)。
6、數(shù)據(jù)庫操作:查詢所搜到的新聞,刪除無用新聞并導(dǎo)出。
親,此軟件需要安裝微軟.net 環(huán)境
微軟.NET Framework 4.0下載地址:http://sfsensi.com/soft/21724.html
微軟.NET Framework 3.5下載地址:http://sfsensi.com/soft/18302.html
微軟.NET Framework 2.0下載地址:http://sfsensi.com/soft/15906.html
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版