截取含有Html代碼的文本段的實戰(zhàn)經(jīng)驗分享
這篇文章提供給大家分享的是關于作者截取含有Html代碼的文本段的實戰(zhàn)經(jīng)驗分享,希望能給大家?guī)韼椭騿l(fā)。
這應該是開發(fā)WEB程序中經(jīng)常遇到的問題。
<%
'文本段代碼
Dim fString
fString = "<P><FONT size=3><SPAN class=jlineheight id=InfoDisp1_labContent style=""FONT-SIZE: 15px; COLOR: black"">中華人民共和國</SPAN></FONT></P><P><FONT size=3><SPAN class=jlineheight style=""FONT-SIZE: 15px; COLOR: black"">中華人民共和國中華人民共和國 中華人民共和國</B></SPAN></FONT></P>"
%>
如果一段文本段含有Html代碼,截取該文本段為10個字符長,相信大家首先使用Len與Left函數(shù),但這些函數(shù)識別的中文漢字當做為一個字符,這樣輸出的結果肯定不會正確。借用自定義函數(shù)CutStr......
<%
'用省略號格式化數(shù)據(jù)標題(兼容中文字)
function CutStr(str,strlen,endStr)
dim cvSt:cvSt=Str
if cvSt="" then
CutStr=""
exit function
end if
dim l,t,c
l=len(cvSt)
t=0
for i=1 to l
c=Abs(Asc(Mid(cvSt,i,1)))
if c>255 then
t=t+2
else t=t+1
end if
if t>=strlen then
cutStr=left(cvSt,i)&endStr
exit for
else cutStr=cvSt
end if
next
cutStr=replace(cutStr,chr(10),"")
cutStr=replace(cutStr,chr(0),"")
end Function
%>
使用CutStr截取:
<%response.write CutStr(fString,10,"...")%>
則輸入結果為html代碼,并不會顯示“中華人民共和國”。顯然,結果是錯誤的!
現(xiàn)在要考慮的先去除Html代碼,再截取字符。
給自動刪除html代碼提供一個函數(shù),使用正則表達式:
<%
'去掉HTML標記
Public Function Replacehtml(Textstr)
Dim Str,re
Str=Textstr
Set re=new RegExp
re.IgnoreCase =True
re.Global=True
re.Pattern="<(.[^>]*)>"
Str=re.Replace(Str, "")
Set Re=Nothing
Replacehtml=Str
End Function
%>
然后再截取字符,整個代碼如下:
<%
'去掉HTML標記
Public Function Replacehtml(Textstr)
Dim Str,re
Str=Textstr
Set re=new RegExp
re.IgnoreCase =True
re.Global=True
re.Pattern="<(.[^>]*)>"
Str=re.Replace(Str, "")
Set Re=Nothing
Replacehtml=Str
End Function
'用省略號格式化數(shù)據(jù)標題(兼容中文字)
function CutStr(str,strlen,endStr)
dim cvSt:cvSt=Str
if cvSt="" then
CutStr=""
exit function
end if
dim l,t,c
l=len(cvSt)
t=0
for i=1 to l
c=Abs(Asc(Mid(cvSt,i,1)))
if c>255 then
t=t+2
else t=t+1
end if
if t>=strlen then
cutStr=left(cvSt,i)&endStr
exit for
else cutStr=cvSt
end if
next
cutStr=replace(cutStr,chr(10),"")
cutStr=replace(cutStr,chr(0),"")
end Function
Dim fString : fString = "<P><FONT size=3><SPAN class=jlineheight id=InfoDisp1_labContent style=""FONT-SIZE: 15px; COLOR: black"">中華人民共和國</SPAN></FONT></P><P><FONT size=3><SPAN class=jlineheight style=""FONT-SIZE: 15px; COLOR: black"">中華人民共和國中華人民共和國 中華人民共和國</B></SPAN></FONT></P>"
response.write "<font color=red>原來的字符集:</font>" & fString & "<p>"
response.write "<font color=red>去除Html代碼的字符:</font>" & Replacehtml(fString) & "<p>"
response.write "<font color=red>轉換后的字符:</font>" & CutStr(Replacehtml(fString),14,"")
%>
最后對文本段fString截取前10個字符,真正顯示的結果就是“中華人民共和國”。