編程的朋友經(jīng)常需要進行數(shù)據(jù)的挖掘,在大量沒有什么用處的數(shù)據(jù)中挖掘出有用的東西,而weka就是一個強大的數(shù)據(jù)挖掘工具,它將數(shù)據(jù)處理、算法和評估集為一體進行綜合的數(shù)據(jù)挖掘,小編這里帶來的是weka中文版,更方便用戶操作使用!
weka漢化版使用說明
在第2版weka中文版的 基礎(chǔ)上制作了第3版,暫定版本v0.3。將guichooser漢化完成。
考慮到大家還是習慣使用guichooser作為默認啟動界面,將RunWeka.ini中的設(shè)置恢復(fù)默認。但是為了支持中文,其中的編碼選項從cp1252改為utf-8,各位同學(xué)制作數(shù)據(jù)文件的時候可以保存為utf-8編碼。也可以自行去修改根目錄下的RunWeka.ini。
本次只發(fā)布了64位的版本,包含64位jre,在根目錄下的jre目錄,需要的可以自行安裝。解壓縮到任意目錄后,運行RunWeka.bat就可以了。
當然也有快捷方式可以用,但圖標因為路徑問題需要你自己重新設(shè)定一下。理論上將根目錄下的weka.jar提取出來覆蓋你之前安裝好的weka目錄中的weka.jar,即可實現(xiàn)weka漢化,32位和64位都可以用,但前提是你安裝的weka版本要是3.7.12。最好事先備份好你的weka.jar文件,出現(xiàn)問題可以恢復(fù)。
weka中怎樣加入自己的算法
1.編寫新算法,所編寫的新算法必須符合Weka 的接口標準。在此以從Weka中文站上下載的一個算法(模糊C均值聚類算法:FuzzyCMeans)的添加為例說明其具體過程。
2.由于FuzzyCMeans是聚類算法,所以直接將FuzzyCMeans.java 源程序考到 weka.clusterers 包下
3.再修改weka.gui.GenericObjectEditor.props ,在#Lists the Clusterers I want to choose from的weka.clusterers.Clusterer=\下加入:weka.clusterers.FuzzyCMeans
4、相應(yīng)的修改weka.gui.GenericPropertiesCreator.props ,此去不用修改,因為包weka.clusterers已經(jīng)存在,若加入新的包時則必須修改這里,加入新的包我試了一下,這樣加入之后,重新編譯,運行后,可以在weka的Explorer界面上的Cluster選項卡中的聚類算法中找到剛剛新添加的FuzzyCMeans算法。
添加過程簡單吧!關(guān)鍵問題是要弄清楚Weka的內(nèi)核以及其接口標準,然后編寫出符合此規(guī)范的新算法。
weka中怎么連接數(shù)據(jù)庫
1)新建文件夾lib和文件夾weka,然后將mysql-connector-java-5.1.6-bin.jar復(fù)制到lib文件夾中
2)“我的電腦”屬性,設(shè)置環(huán)境變量
新建變量WEKA_HOME=weka的安裝目錄,如(D:\Prgrams\weka-3.6)
在CLASSPATH變量中添加“;%WEKA_HOME%\lib\mysql-connector-java-5.1.6-bin.jar”
3)將weka.jar解壓到weka文件夾(新建)中,然后進入weka\experiment,找到DatabaseUtils.props(缺省使用)將其重新命名備份;假設(shè)我們要連接的mysql數(shù)據(jù)庫,則將DatabaseUtils.props.mysql重新命名為DatabaseUtils.props,然后做如下修改:
# JDBC driver (comma-separated list)
#jdbcDriver=org.gjt.mm.mysql.Driver
修改為:jdbcDriver=com.mysql.jdbc.Driver
# database URL,保持不變
jdbcURL=jdbc:mysql://server_name:3306/database_name ~
weka中文版詳細使用教程
- PC官方版
- 安卓官方手機版
- IOS官方手機版