spire office主要是能幫助開(kāi)發(fā)人員創(chuàng)建、讀取、轉(zhuǎn)換、打印word文件和寫(xiě)入設(shè)計(jì)庫(kù)的開(kāi)發(fā)工具,因?yàn)槭仟?dú)立的.NET組件,不用安裝到word等辦公軟件上就能使用,但它能將微軟文檔創(chuàng)建功能集成到開(kāi)發(fā)者的應(yīng)用程序中,可以說(shuō)是一個(gè)非?煽康腗S Word 的API。
spire office組件使用說(shuō)明
一、文本提取
通常我們?cè)谧鲆恍┪臋n索引或者文檔解析的時(shí)候,需要得到文檔的純文本內(nèi)容,這樣便于對(duì)不同格式的文檔進(jìn)行通用的處理。最常見(jiàn)的就是將文檔內(nèi)容作為索引提交的搜索引擎,從而實(shí)現(xiàn)對(duì)不同格式文檔的搜索。
通過(guò)Spire.Office的Doc和Pdf組件能比較方便的抽取文檔的文本,需要用到以下兩個(gè)組件
Spire.Doc
Spire.Pdf
demo界面
抽取Word文檔
以下代碼是加載一個(gè)文件流,這個(gè)示例是讀取上傳的文件流,然后遍歷文檔的每個(gè)section,再遍歷每個(gè)section下的Paragraph,讀取里面的文本,得到最終的文檔文本內(nèi)容。
下圖是用于提取的doc文檔以及提取后純文本內(nèi)容
(word原文)
(抽取后的原文)
抽取Pdf文檔
類似于Word文檔抽取,代碼直觀明了,加載文件流,然后遍歷每一頁(yè),提取文本。
下圖是用于提取的pdf文檔以及提取后純文本內(nèi)容
(pdf原文)
(抽取后的文本)
二、導(dǎo)出Excel數(shù)據(jù)
導(dǎo)出Excel也是開(kāi)發(fā)中經(jīng)常遇到的爛大街功能,初期使用過(guò)response直接寫(xiě)csv文件,之后用上了專業(yè)的組件比如NPOI,現(xiàn)在用Spire.Xls組件來(lái)看看效果如何。
demo界面,為了方便演示,直接讓用戶提交數(shù)據(jù)庫(kù)連接字符串和查詢語(yǔ)句,然后導(dǎo)出Excel文件
關(guān)鍵代碼
大概步驟就是,創(chuàng)建一個(gè)Workbook,然后將從數(shù)據(jù)庫(kù)得到的DataTable插入到shee中,幾行代碼比較便捷的得到包含數(shù)據(jù)的Excel文件
導(dǎo)出的文件效果
導(dǎo)出Excel文檔效果(基于[AdventureWorks2014].[Production].[Product]表)
由于用的是評(píng)估版,所以導(dǎo)出的Excel最后一個(gè)sheet是一些試用提示信息
三、生成文檔
文檔生成通常用于動(dòng)態(tài)從數(shù)據(jù)庫(kù)讀取一些變化的數(shù)據(jù),然后套用某個(gè)模板將數(shù)據(jù)填入,最終生成看起來(lái)一個(gè)有模有樣的文檔,通常是那種八股文。曾經(jīng)做個(gè)簡(jiǎn)歷導(dǎo)出,就是用的類似的方式,實(shí)現(xiàn)將同一份數(shù)據(jù)導(dǎo)出成不同的文檔格式。
這里使用Spire.Doc和Spire.Pdf兩大組件,實(shí)現(xiàn)創(chuàng)建word和pdf文檔的功能
demo界面,通過(guò)輸入文檔標(biāo)題,文檔名,若干個(gè)文檔段落生成文檔
關(guān)鍵代碼
實(shí)現(xiàn)過(guò)程有點(diǎn)類似于文本抽取的逆向操作
創(chuàng)建Word文檔
依次設(shè)置標(biāo)題以及各個(gè)段落的內(nèi)容
生成文檔效果,由于是評(píng)估版,還是被硬生生的插入了一段提示,并且生成的word文檔不能編輯(付費(fèi)后應(yīng)該是可以編輯的)
創(chuàng)建Pdf文檔
創(chuàng)建過(guò)程類似于使用canvas畫(huà)板,生成一個(gè)簡(jiǎn)單文檔還不算復(fù)雜
生成文檔效果,同樣也是毫無(wú)違和感的被插入了評(píng)估版的提示。這里看到使用的是英文內(nèi)容,因?yàn)槟壳皽y(cè)試評(píng)估版輸入中文生成文檔會(huì)顯示為亂碼,還沒(méi)找到設(shè)置編碼的方式
spire office組件功能介紹
開(kāi)發(fā)人員可以使用Spire.Office for .NET創(chuàng)建大量的含有文檔編輯功能的應(yīng)用程序,這些文檔編輯功能包括打開(kāi)、創(chuàng)建、修改、轉(zhuǎn)換、打印、查看MS Word/Excel/PDF文檔,并且允許用戶將數(shù)據(jù)導(dǎo)出為MS Word/Excel/RTF/Acces、PDF、XPS、HTML、XML、Text、CSV、DBF、Clipboard、SYLK等格式的文件。
作為一種獨(dú)立的Office .NET組件,Spire.Office的運(yùn)行系統(tǒng)無(wú)需安裝Microsoft Office,基于安全性、穩(wěn)定性、可擴(kuò)展性、速度、價(jià)格和功能等考慮,它是實(shí)現(xiàn)辦公自動(dòng)化更好的選擇。
Spire.Office for .NET可以鏈接到任何一個(gè)32位或64位的.NET應(yīng)用,包括ASP.NET、Web Services和從2.0到4.0版本的WinForms for .NET框架。
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版