2、 增加對(duì)英文專業(yè)名詞的支持 如C++,C#等只要加入字典就可以被分出來
3、 增加詞頻判斷功能,在無法取舍時(shí)根據(jù)詞頻取舍
4、 增加優(yōu)先優(yōu)先詞頻選項(xiàng),通過這個(gè)選項(xiàng)動(dòng)態(tài)決定分詞粒度 需打開 FreqFirst
5、 增加中文人名前后綴統(tǒng)計(jì)和根據(jù)該統(tǒng)計(jì)定位人名的功能
6、 增加中文人名和未登錄詞出現(xiàn)頻率統(tǒng)計(jì)功能
7、 增加自動(dòng)更新字典功能,對(duì)超過閾值的人名和未登錄詞自動(dòng)插入字典 需打開 AutoInsertUnknownWords 開關(guān) 并設(shè)置 UnknownWordsThreshold,(不推薦自動(dòng)插入,推薦手工插入)
8、 增加定期保存字典和統(tǒng)計(jì)結(jié)果功能 需設(shè)置 AutoSaveInterval
9、 增加KTDictSeg.xml配置文件來配置分詞參數(shù)
10、增加對(duì)Lucene.net 的支持,提供 KTDictSegAnalyzer 分析器給Lucene.net
11、增加字典管理功能,可以添加刪除修改字典
12、字典管理中提供從未登錄詞中批量插入字典功能,可幫助使用者手工選擇合適的未登錄詞插入字典(推薦)
13、提供一個(gè)新聞搜索的簡單例子,采用Lucene.net+KTDictSegAnalyzer+KTDictSeg,項(xiàng)目名為Demo.KTDictSegAnalyzer
14、將所有ArrayList 改為List<>
字典管理工具 DictManage.exe
界面:
新聞搜索例子 Demo.KTDictSegAnalyzer.exe
界面
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版