- 1. 文件名批量讀取(可以設(shè)置是否帶后綴名) V1.0 簡體中...
- 2. Java Portable 6 Update 26
- 3. TaskUnifier(java編寫的gtd任務(wù)管理工具) V0.9.7 多...
- 4. Java SE Runtime Environment 6 Update 26 x64官方...
- 5. Java SE Runtime Environment 6 Update 26官方免費(fèi)...
- 6. ComicsViewer(專為漫畫開發(fā)的瀏覽器)最新官方下載 ...
- 7. 我心飛揚(yáng)類加密工具(java class文件加密工具) V2.0...
- 8. MozillaHistoryView(支持firefox/mozilla/netscape...
- 9. 墨客書蟲(手機(jī)閱讀器軟件)for Java V1.10 免費(fèi)通...
- 10. CSVed(CSV 文件操作工具) V2.0.1 英文綠色版
Java讀取Csv實(shí)例所應(yīng)該注意的事項(xiàng)
作者: 來源: 發(fā)布時(shí)間:2011-4-26 12:00:10 點(diǎn)擊:
Csv文件,逗號(hào)分隔的常用數(shù)據(jù)文件格式,默認(rèn)可以用Office軟件打開。 ]_fxnu
維基百科對CSV的詳細(xì)描述: 看項(xiàng)目中以前的處理方式是直接用用java IO類庫讀取Csv文件,實(shí)際處理中發(fā)現(xiàn)Csv文件本身包含了對各種特殊字符的處理信息。最常見的比如: kC> uk( 8v
1. 對包含特殊字符的字符串?dāng)?shù)據(jù)首尾加雙引號(hào) KoM'`oY 2
2. 對數(shù)據(jù)中的單個(gè)雙引號(hào)前加單個(gè)雙引號(hào) (<=2FAP_
其它... PpFCQsnS#
所以用Java IO讀到的字符串全是經(jīng)過處理后的字符串,在某些場景下是不符合預(yù)期需求的。比如我需要的是不做任何處理的原始內(nèi)容。 fy5M4 項(xiàng)目中另一種常見的文件格式Excel用了POI來處理,但是POI不支持Csv格式,于是找到了javacsv。 ,#FT4i;F/
代碼很簡單: z#zQ7v`H
Java代碼 YIhhyP
public List importCsv(String file) { hq^ v+bCI
List list = new ArrayList(); wV5:88f
CsvReader reader = null; `brM,x^0_
try { U#F Kn8
//初始化CsvReader并指定列分隔符和字符編碼 T >![2RBl
reader = new CsvReader(file, ',', Charset.forName("GBK")); >} `%"-*c
while (reader.readRecord()) { $k8)*ZoX
//讀取每行數(shù)據(jù)以數(shù)組形式返回 ywl5O=kL
String[] str = reader.getValues(); mj3?7aq
if (str != null && str.length > 0) { 3q# :5N.
if (str[0] != null && !"".equals(str[0].trim())) { qEj"TC
list.add(str); 7Qz2w\9K
} T[a2(tO
} +4lefN`G&
} !LVKo&x:
} catch (FileNotFoundException e) { d)I)nn![
log.error("Error reading csv file.",e); g-KSVJ
} catch (IOException e) { ^(9 !{HP3]
log.error("",e); F^PV<Y
} lY,O1 )}|
finally{ =MOo:Xz
if(reader != null) !>nk5]Hp
//關(guān)閉CsvReader N_s iM35-
reader.close(); ~}] L r
} |K=a:
return list; -o"PK`|
} R}qKz4Bg
以上代碼有幾個(gè)要點(diǎn): -8:w_/|#
1 初始化CsvReader時(shí)指定分隔符和字符編碼,如果不指定,默認(rèn)分別為逗號(hào)和ISO-8859-1,我用了GBK,具體使用時(shí)要看當(dāng)時(shí)的字符編碼而定。 mlM:7(+d
2 讀取每行數(shù)據(jù),返回字符串?dāng)?shù)組,數(shù)組內(nèi)的順序即文件數(shù)據(jù)列的順序 eascCFna
3 最后記得關(guān)閉CsvReader 3^DJGA9
是不是很簡單,返回的數(shù)組格式也正好是我想要的,而且拿到是原始的數(shù)據(jù),沒有經(jīng)過特殊字符處理。 !*=0Ydk
有些童鞋質(zhì)疑特殊字符未經(jīng)處理,插到數(shù)據(jù)庫會(huì)出錯(cuò),其實(shí)大可不必我們手工處理,一些基礎(chǔ)組件比如JDBC的preparedstatement已經(jīng)包含了對特殊字符的處理,我們只要以綁定參數(shù)的形式來傳送這些包含特殊字符的數(shù)據(jù)就可以。常用的持久化框架底層也封裝了JDBC,自然也對特殊字符做了處理。 vDh#^T1h+8
維基百科對CSV的詳細(xì)描述: 看項(xiàng)目中以前的處理方式是直接用用java IO類庫讀取Csv文件,實(shí)際處理中發(fā)現(xiàn)Csv文件本身包含了對各種特殊字符的處理信息。最常見的比如: kC> uk( 8v
1. 對包含特殊字符的字符串?dāng)?shù)據(jù)首尾加雙引號(hào) KoM'`oY 2
2. 對數(shù)據(jù)中的單個(gè)雙引號(hào)前加單個(gè)雙引號(hào) (<=2FAP_
其它... PpFCQsnS#
所以用Java IO讀到的字符串全是經(jīng)過處理后的字符串,在某些場景下是不符合預(yù)期需求的。比如我需要的是不做任何處理的原始內(nèi)容。 fy5M4 項(xiàng)目中另一種常見的文件格式Excel用了POI來處理,但是POI不支持Csv格式,于是找到了javacsv。 ,#FT4i;F/
代碼很簡單: z#zQ7v`H
Java代碼 YIhhyP
public List importCsv(String file) { hq^ v+bCI
List list = new ArrayList(); wV5:88f
CsvReader reader = null; `brM,x^0_
try { U#F Kn8
//初始化CsvReader并指定列分隔符和字符編碼 T >![2RBl
reader = new CsvReader(file, ',', Charset.forName("GBK")); >} `%"-*c
while (reader.readRecord()) { $k8)*ZoX
//讀取每行數(shù)據(jù)以數(shù)組形式返回 ywl5O=kL
String[] str = reader.getValues(); mj3?7aq
if (str != null && str.length > 0) { 3q# :5N.
if (str[0] != null && !"".equals(str[0].trim())) { qEj"TC
list.add(str); 7Qz2w\9K
} T[a2(tO
} +4lefN`G&
} !LVKo&x:
} catch (FileNotFoundException e) { d)I)nn![
log.error("Error reading csv file.",e); g-KSVJ
} catch (IOException e) { ^(9 !{HP3]
log.error("",e); F^PV<Y
} lY,O1 )}|
finally{ =MOo:Xz
if(reader != null) !>nk5]Hp
//關(guān)閉CsvReader N_s iM35-
reader.close(); ~}] L r
} |K=a:
return list; -o"PK`|
} R}qKz4Bg
以上代碼有幾個(gè)要點(diǎn): -8:w_/|#
1 初始化CsvReader時(shí)指定分隔符和字符編碼,如果不指定,默認(rèn)分別為逗號(hào)和ISO-8859-1,我用了GBK,具體使用時(shí)要看當(dāng)時(shí)的字符編碼而定。 mlM:7(+d
2 讀取每行數(shù)據(jù),返回字符串?dāng)?shù)組,數(shù)組內(nèi)的順序即文件數(shù)據(jù)列的順序 eascCFna
3 最后記得關(guān)閉CsvReader 3^DJGA9
是不是很簡單,返回的數(shù)組格式也正好是我想要的,而且拿到是原始的數(shù)據(jù),沒有經(jīng)過特殊字符處理。 !*=0Ydk
有些童鞋質(zhì)疑特殊字符未經(jīng)處理,插到數(shù)據(jù)庫會(huì)出錯(cuò),其實(shí)大可不必我們手工處理,一些基礎(chǔ)組件比如JDBC的preparedstatement已經(jīng)包含了對特殊字符的處理,我們只要以綁定參數(shù)的形式來傳送這些包含特殊字符的數(shù)據(jù)就可以。常用的持久化框架底層也封裝了JDBC,自然也對特殊字符做了處理。 vDh#^T1h+8
[收藏此文章]
- 1. 關(guān)于ASP中從ACCESS數(shù)據(jù)庫中讀取images的方法分享
- 2. Javascript的回調(diào)機(jī)制的經(jīng)典教程
- 3. 提供分享關(guān)于Javascript一些方法和屬性的總結(jié)
- 4. 對Java語言認(rèn)識(shí)的誤區(qū)
- 5. Java中全半角之間如何轉(zhuǎn)換
- 6. 教你區(qū)別Java引用與C指針
- 7. Java讀取Csv實(shí)例所應(yīng)該注意的事項(xiàng)
- 8. 2011十二大IT技術(shù)Java仍然占主導(dǎo)地位
- 9. 使用Javascript開發(fā)移動(dòng)應(yīng)用程序
- 10. JavaScript與jQuery 相關(guān)問題解答