提起斗魚的女主播們,大家第一時間想到的應該都是貌美如花。今天小編就帶領大家抓取斗魚直播主播們的封面照片,通過他們的封面照片來尋找自己最喜歡的女主播,一起來看看吧。

01.程序講解
今天,我們所獲取的封面照片包含了三個直播的類別,分別是“娛樂天地”下的顏值、互動交友和舞蹈三個模塊。

我們首先來看顏值主播板塊,看一下如何獲取主播們的直播封面圖吧。
不同于我們之前抓取的靜態頁面,斗魚網站的信息無法從網頁的源代碼中進行獲取,而是需要我們耐心地去分析它的網頁加載內容,找出我們需要的接口鏈接。大家需要點擊鍵盤的F12快捷鍵,進入到開發者模式下,找到network選項下的XHR請求內容,如下圖所示:

02.尋找接口
我們所尋找的接口內容就包含在HXR的請求當中,那我們如何找到對應的接口呢,這里我們可以通過切換不同的直播類型,來觀察XHR請求內容的變化,來找到對應的接口內容,如下圖所示:
通過上面的視頻可以發現,當我們不斷地切換不同的直播類型時,XHR請求當中會彈出名字為”1“的內容,這樣我們就可以輕松的找到我們需要的內容了,如下圖所示。

接下來我們就只需要用程序,模擬瀏覽器向這個接口發送請求,就可以獲取到數據內容。
有的小伙伴按照我們上述的方法找到url請求鏈接,并獲取到數據后,可以發現,數據返回的是json數據內容,而且數據量非常的大,沒有經驗的小伙伴,可能一時之間也難以從數據中獲得我們想要的圖片鏈接。如下圖所示:

這個時候,就可以借助一些輔助的工具幫助我們分析數據,大家只需要將這些json數據進行復制,然后打開網址:https://www.json.cn/。將json數據復制上去,網頁就會自動地幫助我們將json數據解析成方便我們觀察的數據了。

通過解析后的數據,我們可以獲取到很多的信息,包括主播的昵稱,以及我們想要獲取得到的主播的封面圖片。接下來我們就可以通過程序來獲取所有主播們的封面圖。而針對于互動交友和舞蹈模塊的主播封面圖,它們的內容解析和顏值模塊主播的解析是一致的。對于封面圖片的url鏈接的獲取,程序如下圖所示。

程序中,分別針對于顏值、互動交友和舞蹈三個模塊下的鏈接進行請求,并解析返回的json數據,獲取主播們的昵稱和封面圖片的url地址,將內容保存到self.pic_urls的列表中。
獲取到圖片url地址后,接下來就是請求圖片數據,然后保存到本地的文件夾中,程序如下圖所示。

程序中,以主播的名字命名圖片,然后將請求到的圖片數據,寫入到本地的文件夾中。最后我們來看一下獲取得到的圖片內容吧。

總結
以上就是小編今天帶給大家的分享,大家可以獲取抓取好的主播封面,每張圖片都以主播的昵稱進行命名,不知道大家喜歡哪個主播,歡迎在留言區吱一聲哦!