下載君這個(gè)是網(wǎng)友原創(chuàng)的一個(gè)工具,是一個(gè)能自動(dòng)尋找并爬取漂亮小姐姐圖片的下載利器,一個(gè)通用的圖片下載器,能夠自動(dòng)識別網(wǎng)址,將大家想要的圖片識別過濾出來,還可以免費(fèi)下載下來。
工具介紹
我的宗旨是你只要提供一個(gè)網(wǎng)址,剩下的交給我!
下載君能下美女圖片、壁紙圖片、頭像圖片等等,只要是圖的,盡量爭取都能下載,是一款有一定通用性的圖片下載利器。
下載君會(huì)自動(dòng)發(fā)現(xiàn)給定目標(biāo)網(wǎng)址所在的網(wǎng)站的頁面,不會(huì)跑到站外去的。
下載君使用教程
訪問深度:不要設(shè)置太高,因?yàn)檫@東西是超級指數(shù)型增長的,比如設(shè)置3,就能發(fā)現(xiàn)幾千新頁面(網(wǎng)站不同,這個(gè)也不同)。
圖片線程:也不要太高,夠用就行,高了一方面對網(wǎng)站不友好,另一方面則有可能因?yàn)樵L問頻次太高而被Ban掉,得不償失。要以時(shí)間換空間。
工具只需要正確配置網(wǎng)頁元素的xpath就可以愉快的運(yùn)行了,所以重點(diǎn)還是介紹一下如何正確使用xpath。
使用chrome瀏覽器打開網(wǎng)頁,可以看到我們想要的文章內(nèi)部圖片一共15張,其他圖片不是我們要的。
在目標(biāo)圖片上右鍵,選擇【檢查】,打開網(wǎng)頁元素頁面:
在元素上,右鍵>copy>copy xpath,如下圖:
我們將得到這么一條xpath:
//*[@id="syno-nsc-ext-gen3"]/div[3]/div[3]/div[1]/div[1]/ul/li[7]/img
可以看到他是按照html的網(wǎng)頁結(jié)構(gòu)一層一層定位到這張img的元素上的,而我們需要所有元素怎么辦呢?
我們往上一級查看,圖片在<li>中,<li>在<p>中,而<ul>中有2個(gè)<p>,圖片所在的<p>是第一個(gè)。
因此,改造一下xpath:
//*[@class="pics"]/*/img
意為尋找class屬性為pics的元素其內(nèi)部的img元素。至于前后的*表示任意層級。
找到元素后,我們需要獲知的是其src屬性值(圖片地址),于是圖片的xpath就變成了:
//*[@class="pics"]/*/img/@src
我們測試一下,成功發(fā)現(xiàn)15張圖片,如下圖:
至于標(biāo)題,可以默認(rèn)不變,會(huì)找網(wǎng)頁整個(gè)的標(biāo)題,此時(shí)配合【標(biāo)題過濾】可以剔除一部分通用的文字,但如果想要更加精確,就需要準(zhǔn)確找到其大標(biāo)題了
如上圖,標(biāo)題所處的元素是<p>內(nèi),其在<div class='hd'>下,而這個(gè)div內(nèi)部有2個(gè)p,我們選第一個(gè)。而我們要的是<p>內(nèi)的文字,因此要加text()方法,最終如下:
//*[@class="hd"]/p[1]/text()
更新日志
1、支持定義蜘蛛訪問深度。
2、支持定義圖片線程。
3、支持圖片尺寸過濾。
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版