東坡下載:內(nèi)容最豐富最安全的下載站!

幫助|文件類型庫|最新更新|下載分類|排行榜

上傳下載服務(wù)器軟件遠(yuǎn)程監(jiān)控網(wǎng)絡(luò)相關(guān)主頁瀏覽主頁制作電子郵件網(wǎng)站優(yōu)化網(wǎng)絡(luò)儲(chǔ)存常用瀏覽器迅雷百度云盤

首頁網(wǎng)絡(luò)軟件主頁制作 → 網(wǎng)頁正文提取器 1.0 官方版

網(wǎng)頁正文提取器

網(wǎng)頁正文提取器1.0 官方版

  • 大。463KB
  • 語言:中文
  • 平臺(tái):WinAll
  • 更新:2015-12-09 10:33
  • 等級(jí):
  • 類型:主頁制作
  • 網(wǎng)站:http://www.njwzjs.cn/
  • 授權(quán):免費(fèi)軟件
  • 廠商:
  • 產(chǎn)地:國產(chǎn)軟件
好用好玩 50%(0)
坑爹 坑爹 50%(0)
軟件介紹軟件截圖相關(guān)軟件軟件教程網(wǎng)友評(píng)論下載地址

網(wǎng)頁正文提取器是一款強(qiáng)大的網(wǎng)頁提取軟件,該軟件通過對(duì)比分析搜狐、新浪、騰訊、網(wǎng)易、中國新聞網(wǎng)、百度、21cn網(wǎng)、中華網(wǎng)等大型門戶網(wǎng)站,詳細(xì)的分析其噪音數(shù)據(jù)的特點(diǎn),然后根據(jù)超文本協(xié)議的結(jié)構(gòu)特點(diǎn),可以非常方便的提取網(wǎng)頁正文,有需要的趕緊來東坡下載使用吧。

可以快速提取出網(wǎng)站的正文,標(biāo)題,并且去除外鏈的,完全免費(fèi),無廣告,軟件由易語言編寫,個(gè)別殺毒軟件會(huì)報(bào)錯(cuò),絕對(duì)無毒,直接打開就好,直接使用,操作簡單,不需要安裝。

網(wǎng)頁正文提取器使用方法

  輸入要提取的網(wǎng)頁地址

  點(diǎn)擊讀取,即可讀取文章內(nèi)容

如何提取網(wǎng)頁文字

★一、通過使用IE瀏覽器“文件”下拉菜單中的“發(fā)送”之“電子郵件頁面”的操作,在電子郵件頁面中去復(fù)制,從而實(shí)現(xiàn)下載的目的。

★二、可以通過使用IE瀏覽器“的編輯器功能,如WORD等軟件,在編輯狀態(tài)下可以實(shí)現(xiàn)復(fù)制和下載。復(fù)制網(wǎng)頁地址,打開Microsoft Office Word,點(diǎn)擊"文件"——“打開”,在彈出的對(duì)話框中填出剛才復(fù)制的網(wǎng)頁地址或者按下ctrl+v組合鍵,點(diǎn)“打開”按鈕,在打開網(wǎng)頁之前,可能會(huì)彈出“Word 沒有足夠的內(nèi)存,此操作完成后無法撤消。是否繼續(xù)?”的提示窗口,單擊“是”,即彈出新的窗口,詢問是否信任文件來源,再單擊“是”后,Word會(huì)自動(dòng)鏈接到對(duì)應(yīng)的服務(wù)器并打開網(wǎng)頁,這時(shí)我們就可以選中其中的文字進(jìn)行復(fù)制粘貼了。另外,此法在WPS2005中也可以使用,操作起來十分方便。這樣復(fù)制、剪切隨君所愿。

★三、可以通過使用IE瀏覽器“查看”菜單之“源文件”功能,在彈出的窗口中可以找到你需要復(fù)制和下載的內(nèi)容,但沒有格式。除此之外,還可以通過其他比較具有特殊功能的瀏覽器,如火狐等,實(shí)現(xiàn)一般IE瀏覽器所不能實(shí)現(xiàn)的功能。如果你用的是“遨游”等可以控制腳本的瀏覽器,可以禁用腳本。具體操作(以“遨游”為例):點(diǎn)擊“選項(xiàng)”——“下載控制”——去掉“允許scripts”前的勾,這回可以復(fù)制了吧?如果還不行,干脆把“允許java”和“允許activex”前面的勾也去掉。

★四、更改安全級(jí)別的破解方法: 單擊IE瀏覽器的“工具”——“internet選項(xiàng)”——“安全”,將其中的“internet”的安全級(jí)別設(shè)為最高級(jí)別,“確定”后刷新網(wǎng)頁即可。安全級(jí)別最高的時(shí)候,一切控件和腳本均不能運(yùn)行,再厲害的網(wǎng)頁限制手段統(tǒng)統(tǒng)全部作廢!或者在“安全”選項(xiàng)卡,接下來點(diǎn)擊“自定義級(jí)別”按鈕,在彈出的窗口中將所有腳本全部選擇禁用,確定。然后按F5刷新頁面,這時(shí)我們就能夠?qū)W(wǎng)頁的內(nèi)容進(jìn)行復(fù)制、粘貼等操作。當(dāng)你收集到自己需要的內(nèi)容后,再用相同步驟給網(wǎng)頁腳本解禁,這樣就不會(huì)影響到我們?yōu)g覽其他網(wǎng)頁了。

★五、我們來了解一下為什么不能被復(fù)制。

當(dāng)前很多網(wǎng)頁制做者都不想讓自己網(wǎng)頁中的內(nèi)容直接就讓人給復(fù)制去,有的是為了版權(quán)、有的是為了讓人再回來看這段文字,提高他的訪問量等等,具體原因我也說不清的啦^_^。他們一般會(huì)在網(wǎng)頁代碼 中加入以下一個(gè)或多個(gè)代碼:

onpaste="return false" 不準(zhǔn)粘貼

oncopy="return false;" 不準(zhǔn)復(fù)制

oncut="return false;" 防止剪切

onselectstart = "return false" 不準(zhǔn)選擇

例如: ,這是一個(gè)典型的不讓選擇復(fù)制的語句。好啦,現(xiàn)在我們知道為什么不能被復(fù)制了,那我們就可以針對(duì)這些代碼下藥了。

第一步:打開你想要復(fù)制的那個(gè)網(wǎng)站。

第二步:將該網(wǎng)頁另存到你的電腦上(文件|另存為|XXX.html)。

第三步:用記事本打開你剛保存的網(wǎng)頁,找到 這段代碼(不一定完全是這樣的),你把里面的代碼(除body)全部刪除,最后就剩 ,保存文件。

第四步:雙擊打開你剛保存的那個(gè)網(wǎng)頁,用鼠標(biāo)選擇你想要的那些文字,是不是可以選擇并復(fù)制下來了呢?

★六、如果上面的方法你不很熟悉,不愿意用,還有另外的好辦法:文件——另存為——txt文本文檔,然后打開所存的文本文檔,你想怎么復(fù)制就怎么復(fù)制。但是這個(gè)方法只對(duì)文字信息有效,圖片信息將會(huì)失去。

但是,有時(shí)你按照上述多種途徑仍然不能實(shí)現(xiàn)復(fù)制或者下載的目的時(shí),我便提醒諸位,還有另一絕招,即通過查找相關(guān)標(biāo)題內(nèi)容的網(wǎng)頁快照的辦法,目前百度、GOOGLE等搜索引擎都具有網(wǎng)頁快照的功能,這當(dāng)然是復(fù)制和下載的最好辦法。

PC官方
安卓官方手機(jī)版
IOS官方手機(jī)版

網(wǎng)頁正文提取器截圖

下載地址

網(wǎng)頁正文提取器 1.0 官方版

熱門評(píng)論
最新評(píng)論
發(fā)表評(píng)論 查看所有評(píng)論(0)
昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
字?jǐn)?shù): 0/500 (您的評(píng)論需要經(jīng)過審核才能顯示)

編輯推薦

報(bào)錯(cuò)

請(qǐng)簡要描述您遇到的錯(cuò)誤,我們將盡快予以修正。

轉(zhuǎn)帖到論壇
輪壇轉(zhuǎn)帖HTML方式

輪壇轉(zhuǎn)帖UBB方式