跟著IG潮流來爬蟲 — 如何獲取貼文圖片&影片連結 — 系列4(附Python程式碼) | by Clarissa RJ Tai | Marketingdatascience | Medium
第一步,同樣是打開網頁檢視器(Windows系統:請按f12、macOS系統:請按option+command+c)。打開後可以看到以下視窗(圖一)。

接著點選視窗左上角的小鼠標(圖二)。這時當我們任意的在網頁上滑動,旁邊的藍色網底區塊應該也會跟著移動。

當我們將鼠標移到圖片上並點擊,旁邊的網頁檢視器會將對應到的網頁元素碼區域標示出來,如圖三。

咦!?怎麼什麼東西都沒有啊?
不用擔心,這是很正常的,因為我們可能不是直接點到網頁上的圖片,而是點到一些功能介面、網頁板塊之類的網頁元素,這時只要展開附近的階層,通常就能找到需要的內容囉!(需要的資訊通常會在上下層級內)。
因此我們將上一層展開,馬上發現到了圖片連結!太好了!如圖四所示。

在換到下一張圖片之前,別忘了先簡單記憶一下classname(在這裡是KL4Bh)!有了classname我們才能透過Selenium抓到他們!
接著繼續嘗試下一張圖片,使用同樣的方法也可以順利找到圖片的連結,而且classname也是一樣的呢!如圖五所示。

不過等等,連結怎麼會有這麼多?!

別緊張,我們來仔細觀察一下,有沒有看到特別的地方呢?
原來srcset裡的這些連結,是為了因應Instagram不同大小的介面,而儲存了大小不同的圖片檔案,
這時當然就可以依據自己的需求下載不同大小的圖片檔案啦!
不過通常大家都想要最高畫質的圖片檔案,答案就在靠近的底下的src裡面!
趕快檢查一下連結能不能使用吧!開啟連結之後,會出現只有一張圖片的畫面,而這張圖片應該就會是我們剛剛點擊的圖片內容啦!(可愛的魚~),如圖七所示。

進入連結的網頁後,這裡的圖片就可以另存下載了!
影片(或IGTV)也是使用同樣的方式,即可以找到影片的首頁縮圖及影片檔案,大家可以自己嘗試看看。
以下進入相關程式碼的說明。