裝GoFullPage之類的截圖插件也可以實現滾動截圖,不過插件的截圖效率肯定不如瀏覽器自帶的工具,而且安裝插件對于瀏覽器的內存占用,網頁加載等多少會有點影響。
那么不安裝插件,Chrome瀏覽器如何實現滾動截圖?
以前Chrome網頁滾動截圖可以用開發者工具里的Capture full size screenshot命令,而現在這個命令搜不到了。
實際上新版本的Chrome把這個截圖命令移到了可視化界面中,并且現在可以設置快捷鍵,使用起來比之前更方便。
首先還是打開開發者工具,然后找到“設置”;
在設置窗口的左側導航最下邊找到“快捷鍵”,右側往下翻,找到“屏幕截圖”,這里就可以對4中截圖命令設置快捷鍵。
使用的時候,還是要先打開開發者工具這個窗口,然后用設置好的快捷鍵快速實現網頁滾動截圖。
Chrome瀏覽器開發者工具是一款非常強大且易于使用的前端開發工具。其優點包括但不限于以下幾點:
實時編輯:可以直接在瀏覽器中編輯HTML、CSS和JavaScript代碼,并且頁面可以實時更新。
調試JavaScript代碼:提供了豐富的調試工具,比如斷點、監控變量、堆棧跟蹤等,方便我們快速定位和解決JavaScript代碼問題。
查看元素:您可以輕松查看元素的樣式、盒模型、事件等。您可以快速了解頁面結構,還可以修改樣式以達到設計效果。
網絡分析:提供網絡面板,方便查看網絡請求、響應狀態碼、傳輸大小等信息,以及網絡請求的時間線圖表。
性能分析:提供性能面板,可以幫助我們分析頁面加載性能、資源優化建議等,幫助我們提高頁面性能。
一篇:python學習之路(六):列表、元組、字典、循環語句、條件語句
自學python今天剛好一星期,今天準備來寫第一個正式的腳本代碼,以前知道python,是從網絡爬蟲才開始知道python的。最開始對python的印象就是網絡爬蟲,所以今天的第一個python就寫一個簡單的爬蟲腳本。
在網上找了一個壁紙網頁(http://www.win4000.com/zt/fengjing_1.html),想把里面的壁紙下載保存到電腦,但是一張一張的下載太費力氣了,所以就寫一個python爬取里面的圖片地址,然后保存在電腦上。
寫這個腳本用到前面幾篇文章里講到的一些知識點有:
1、 函數的創建與調用
2、 內置模塊的導入
3、 For循環
4、 字符串編碼(這個前面幾篇里沒講過)
思路:
在這個腳本中用到python內置的模塊有urllib模塊,和re模塊。Urllib模塊是python內置的一個HTTP請求模塊。Re模塊是python內置的一個正則表達式模塊。我們用urllib請求到網頁的源代碼,然后用正則表達式匹配出圖片的下載地址。然后用for循環一張一張的把圖片下載到電腦。
實現:
Urllib里面包括很多子模塊。包括以下模塊
urllib.request 請求模塊
urllib.error 異常處理模塊
urllib.parse url解析模塊
urllib.robotparser robots.txt解析模塊
在這個腳本中只用到請求模塊,所以就只導入urllib.request就好了。
給這個函數一個URL參數,然后用urllib.request請求到網頁源代碼,上面的變量html就是網頁的源代碼。
Html.decode(‘utf-8’)是網頁的編碼,如果編碼不對,請求到的網頁源碼很可能是亂碼的。我們可以在網頁中用鼠標右鍵,然后查看網頁源代碼。
在源代碼的頭部會有這個網頁的編碼,我門根據這個編碼寫到代碼里。
在網頁中鼠標右鍵查看源代碼,可以看到這個網頁的圖片真實地址是放在img標簽的data-original屬性里面。
所以我們的正則表達式就寫成這樣
reg = r'data-original = "(.+?\.jpg)"'
注意data-original后面的等于號兩邊都有空格,所以在正則表達式里也要打空格。
函數返回的imglist就是圖片的url列表。
正則表達式也不是三言兩語能說清的,想了解的可以閱讀百度百科正則表達式:
https://baike.baidu.com/item/正則表達式/1700215
百度百科里面有很詳細的介紹。
用for循環把上一步得到的imglist循環下載到電腦。調用urllib模塊中的urllib.request.urlretrieve函數,把圖片保存在電腦里。我這里是保存在D盤的images目錄下
首先調用getHtml傳入網頁連接,得到源代碼html
然后調用getImg傳入源代碼,得到圖片列表imglist
最后調用downImg傳入圖片列表開始下載
完整代碼如下:
運行結果:
電腦存D盤的images目錄:
再加個循環,我們可以把前幾頁所有的圖片都下載下來。把網頁翻到第二頁。查看第二頁的連接。
可以發現一個規律,網站地址的.thml前面就是下劃線+頁數??梢愿鶕@個規律來下載指定頁數內的所有圖片。只需在調用上面的三個函數的時候,加個循環拼接網頁的地址,循環調用即可。
給downImg函數加個頁數pageNum的參數。然后保存圖片命名以頁數開頭命名。加個頁數開頭以防止后面一頁把前面一頁下載的圖片給覆蓋了。
運行代碼后,前五頁145張圖片都已經下載到電腦里了。
當然上面爬取數據的方式是最簡單的,數據量多的話效率不是很理想,現在有很多優秀的第三方模塊都可以代替內置的模塊,有時間的話我找一個好用的第三方爬蟲模塊來說一下。
本篇文章源代碼文件下載:http://qn.sddman.cn/1515920600000.py
下一篇:python學習之路(八):牛刀小試,使用OCR技術識別圖片文字
ixshaft是一個非常好用的pixiv第三方客戶端,使用它可以非常便捷逛P站,瀏覽各大畫師的精美作品。軟件使用體驗非常好,完全沒有廣告,并且界面非常清爽。
Shaf app是一款可以幫助用戶朋友們帶來超多趣味高清動漫圖片的平臺,該平臺上面各種新圖隨你們在線了解,直接進pixiv事務局獲取超多圖片,各種插畫隨便看,不管用戶是喜歡設置桌面還是頭像統統可用。
1、P站是一款有著大量二次元圖片軟件,大量的精美高清插畫,軟件能夠幫助你快速下載;
2、用戶不需要登錄注冊,下載軟件就能進入到P站頁面,再不用翻某某去才能下載圖片;
3、用戶可以在這里不需要付費就能免費的觀看pixiv,同這款軟件界面簡潔,無廣告。
1、支持用戶查看下載GIF圖片,提供歷史記錄,下載管理功能,多用戶切換;
2、支持無代理直連,非會員搜作品熱度排序,找非常方便高效;
3、軟件可下載收藏以及評論,當然也可以關注自己喜歡的作者。
原文地址:http://www.3h3.com/az/174134.html
*請認真填寫需求信息,我們會在24小時內與您取得聯系。