如何把整個(gè)網(wǎng)頁下載下來
2023-03-13 14:17:53 閱讀(12877)
在日常的網(wǎng)上沖浪中,我們常常會(huì)碰到很多優(yōu)美、富有內(nèi)容的網(wǎng)頁,或許你會(huì)想將其完整地下載下來,或者保存在自己的電腦里,以便今后查閱。不過,有時(shí)單純地保存網(wǎng)頁時(shí)你只能夠下載到其中的文本、圖片等元素,而無法保留其整體架構(gòu)和超鏈接等關(guān)鍵性信息。那么,如何才能將整個(gè)網(wǎng)頁完整地下載下來呢?
一、使用網(wǎng)頁下載工具
相信大多數(shù)人都知道一些能夠下載整個(gè)網(wǎng)頁的工具,比如WebCopy、HTTrack等等。以下我會(huì)為大家詳細(xì)講解用其中之一來實(shí)現(xiàn)整個(gè)網(wǎng)頁的下載操作。
1. 第一步:下載并打開 WebCopy
WebCopy 是一款免費(fèi)的網(wǎng)頁下載軟件,它可以幫助我們將整個(gè)網(wǎng)站下載到本地電腦上,包括網(wǎng)站的所有文件和頁面。首先,需要下載該軟件并安裝好。
2. 第二步:輸入網(wǎng)址
安裝好 WebCopy 之后,可以打開它并輸入你要下載的網(wǎng)頁的網(wǎng)址。需要注意的是,你需要輸入整個(gè)網(wǎng)站的主頁地址,而不是單個(gè)頁面的地址。
3. 第三步:設(shè)置參數(shù)
然后,就需要設(shè)置參數(shù)了。在 WebCopy 的“配置”選項(xiàng)中,有很多設(shè)置可供選擇。但在這里,我們只需要關(guān)注幾個(gè)主要設(shè)置即可完成操作。
i. 保存文件夾
在“配置”選項(xiàng)中,你需要指定將網(wǎng)頁保存在哪個(gè)文件夾下??梢栽凇澳繕?biāo)”欄下添加所要下載網(wǎng)站的文件夾路徑。這里要注意的是,你需要設(shè)置好文件夾的名稱,以便知道這個(gè)文件夾中保存了哪些網(wǎng)站。
ii. 下載選項(xiàng)
在“下載選項(xiàng)”中,你需要設(shè)置網(wǎng)頁類型、文件大小等。這里選擇默認(rèn)設(shè)置即可。
iii. 網(wǎng)頁設(shè)置
在“網(wǎng)頁設(shè)置”中,你可以選擇下載“基本組件”、“所有資源”或“用戶界面資源及 JavaScript”。同時(shí)還可以設(shè)置 User-Agent,使下載更自然,并且不顯露自己的爬蟲身份。
4. 第四步:下載網(wǎng)頁
WebCopy 幫助你做到了真正意義的“網(wǎng)站歸檔”,一些弱網(wǎng)站可能會(huì)提示你訪問過于頻繁,那就請等一會(huì)兒后,再進(jìn)行下載即可。
需要注意的是,下載時(shí)間會(huì)因網(wǎng)站大小的不同而有所不同。下載完成之后,打開文件夾即可查看整個(gè)網(wǎng)頁的文件。
二、使用瀏覽器進(jìn)行保存
不僅可以使用網(wǎng)頁下載工具來保存,在 Chrome、Firefox 等瀏覽器中也有自帶的保存網(wǎng)頁功能。下面我會(huì)以 Chrome 為例來講解如何進(jìn)行保存。
1. 首先,打開你想要保存的網(wǎng)站。
2. 然后,按下 Ctrl + S 鍵,或者直接在網(wǎng)頁上右擊鼠標(biāo),選擇“另存為…”。
3. 接著,設(shè)置保存路徑、文件名和文件類型后進(jìn)行保存即可。
需要注意的是,如果你不想保存網(wǎng)頁中的圖片或 CSS 文件,可以在“保存類型”選項(xiàng)卡中取消勾選對應(yīng)的選項(xiàng),這樣就只會(huì)保存網(wǎng)頁的文本信息。但這種方法同樣也有缺點(diǎn),可能會(huì)出現(xiàn)一些無用的信息,甚至?xí)绊懢W(wǎng)頁排版。
三、使用 Markdown 格式保存
如果你只想保存網(wǎng)頁中的文本內(nèi)容,那么 Markdown 格式可以是一個(gè)不錯(cuò)的選擇。
1. 首先,打開你想要保存的網(wǎng)站。
2. 然后,按下 Ctrl + A 鍵,選中網(wǎng)頁上所有內(nèi)容。
3. 接下來,可以用鼠標(biāo)右擊選中內(nèi)容,然后通過“復(fù)制”操作將其復(fù)制到剪貼板中。
4. 接著,打開 Markdown 編輯器,比如 Typora,將所復(fù)制的內(nèi)容粘貼到編輯器中。
5. 最后進(jìn)行保存,你可以選擇將文件保存為 Markdown 文件和 HTML 文件,然后打開編輯器即可查看整個(gè)網(wǎng)頁的內(nèi)容。
需要注意的是,使用該方式保存網(wǎng)頁時(shí),可能會(huì)出現(xiàn)網(wǎng)頁排版錯(cuò)亂的問題。因?yàn)?Markdown 的排版是以純文本方式保存的,所以如果網(wǎng)頁中包含了一些格式比較特別的內(nèi)容,那么在保存時(shí)可能會(huì)出現(xiàn)問題。