首页 > 跟著IG潮流來爬蟲 — 如何獲取貼文圖片&影片連結 — 系列4(附Python程式碼) | by Clarissa RJ Tai | Marketingdatascience | Medium

跟著IG潮流來爬蟲 — 如何獲取貼文圖片&影片連結 — 系列4(附Python程式碼) | by Clarissa RJ Tai | Marketingdatascience | Medium

互联网 2021-04-22 10:58:23
檢視網頁及找到需要的網頁資訊

第一步,同樣是打開網頁檢視器(Windows系統:請按f12、macOS系統:請按option+command+c)。打開後可以看到以下視窗(圖一)。

圖一、網頁檢視器示意圖。

接著點選視窗左上角的小鼠標(圖二)。這時當我們任意的在網頁上滑動,旁邊的藍色網底區塊應該也會跟著移動。

圖二、點擊彈出視窗左上角的小鼠標。

當我們將鼠標移到圖片上並點擊,旁邊的網頁檢視器會將對應到的網頁元素碼區域標示出來,如圖三。

圖三、網頁元素碼示意圖。

咦!?怎麼什麼東西都沒有啊?

不用擔心,這是很正常的,因為我們可能不是直接點到網頁上的圖片,而是點到一些功能介面、網頁板塊之類的網頁元素,這時只要展開附近的階層,通常就能找到需要的內容囉!(需要的資訊通常會在上下層級內)。

因此我們將上一層展開,馬上發現到了圖片連結!太好了!如圖四所示。

圖四、圖片連結示意圖。

在換到下一張圖片之前,別忘了先簡單記憶一下classname(在這裡是KL4Bh)!有了classname我們才能透過Selenium抓到他們!

接著繼續嘗試下一張圖片,使用同樣的方法也可以順利找到圖片的連結,而且classname也是一樣的呢!如圖五所示。

圖五、找到圖片連結。

不過等等,連結怎麼會有這麼多?!

圖六、圖五的網頁原始碼內容。

別緊張,我們來仔細觀察一下,有沒有看到特別的地方呢?

原來srcset裡的這些連結,是為了因應Instagram不同大小的介面,而儲存了大小不同的圖片檔案,

這時當然就可以依據自己的需求下載不同大小的圖片檔案啦!

不過通常大家都想要最高畫質的圖片檔案,答案就在靠近的底下的src裡面!

趕快檢查一下連結能不能使用吧!開啟連結之後,會出現只有一張圖片的畫面,而這張圖片應該就會是我們剛剛點擊的圖片內容啦!(可愛的魚~),如圖七所示。

圖七、獲取連結的圖片內容。(資料來源:https://www.instagram.com/p/CE_bR-osw4M/)

進入連結的網頁後,這裡的圖片就可以另存下載了!

影片(或IGTV)也是使用同樣的方式,即可以找到影片的首頁縮圖及影片檔案,大家可以自己嘗試看看。

以下進入相關程式碼的說明。

免责声明:非本网注明原创的信息,皆为程序自动获取互联网,目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责;如此页面有侵犯到您的权益,请给站长发送邮件,并提供相关证明(版权证明、身份证正反面、侵权链接),站长将在收到邮件12小时内删除。