網(wǎng)頁快照定義:,英文名叫Web Cache,網(wǎng)頁緩存。搜索引擎在收錄網(wǎng)頁時,對網(wǎng)頁進行備份,存在自己的服務器緩存里,當用戶在搜索引擎中點擊“網(wǎng)頁快照”鏈接時,搜索引擎將Spider系統(tǒng)當時所抓取并保存的網(wǎng)頁內(nèi)容展現(xiàn)出來,稱為“網(wǎng)頁快照”。 由于網(wǎng)頁快照是存儲在搜索引擎服務器中,所以查看網(wǎng)頁快照的速度往往比直接訪問網(wǎng)頁要快。網(wǎng)頁快照中,搜索的關鍵詞用亮色顯示,用戶可以點擊呈現(xiàn)亮色的關鍵詞直接找到關鍵詞出現(xiàn)位置,便于快速找到所需信息,提高搜索效率。當搜索的網(wǎng)頁被刪除或連接失效時,可以使用網(wǎng)頁快照來查看這個網(wǎng)頁原始的內(nèi)容。
為什么我們只要在搜索引擎的搜索框內(nèi)輸入想要查詢的關鍵詞, 搜索引擎就會立即在廣闊無垠的因特網(wǎng)上,把包含關鍵詞所有網(wǎng)頁一網(wǎng)打盡,呈現(xiàn)在我們的面前。如果您了解了搜索引擎的工作原理,就不會這樣認為了。每一張網(wǎng)頁上都有很多超鏈接,鏈接到另外一些網(wǎng)頁上,而這些網(wǎng)頁上依然有很多超鏈接,又可以鏈接到另外一些網(wǎng)頁上,搜索引擎的Spider系統(tǒng)通過這樣的方式,將互聯(lián)網(wǎng)上的大量網(wǎng)頁逐步抓取下來
搜索引擎中的老大哥Google,它的名字就來自于數(shù)學中的一個幾乎不可超越的數(shù):googol,這個數(shù)是10的100次方,在它的網(wǎng)頁數(shù)據(jù)庫中儲存了數(shù)十億張網(wǎng)頁,這些網(wǎng)頁就是通過以上的方式,由Net Spider系統(tǒng)抓取并保存下來的。所有的這些網(wǎng)頁,當在搜索引擎結果中進行展示時,都被稱為 網(wǎng)頁快照。
當用戶使用搜索引擎在因特網(wǎng)上搜索網(wǎng)頁時,那其實就在搜索引擎的網(wǎng)頁數(shù)據(jù)庫中搜索,用戶誤認為搜索引擎一下子就在因特網(wǎng)上找到了包含關鍵詞的網(wǎng)頁。
因特網(wǎng)上的網(wǎng)頁并不是一成不變的,而是不斷增加、刪除、改動。因此,搜索引擎網(wǎng)頁數(shù)據(jù)庫中的網(wǎng)頁也需要及時更新,既把因特網(wǎng)上網(wǎng)頁重新復制一遍,如果你在你的網(wǎng)站上刪除一張網(wǎng)頁,那么搜索引擎數(shù)據(jù)庫中的復制品-網(wǎng)頁快照并不會立刻被刪除,而是要過一段才會被刪除。但是,Google的網(wǎng)頁快照是標示快照存檔時間的,那么,在這個時間點上,該網(wǎng)頁肯定還存在。舉例:2008年7月20日打開一個Google的網(wǎng)頁快照,而這張快照上顯示是Google在7月10日搜索并存檔的。什么意思?這表示:2008年7月20日,這個網(wǎng)頁或許已被刪除或更新,但是,2008年7月10日,當Google對該網(wǎng)頁復制存檔的時候,該網(wǎng)頁是確實存在的。