什麼是頁庫存檔?如何查看?
在大多數的搜尋引擎中,頁庫存檔又稱為快取連結,而英文通常被稱為 Web Page Cache。搜尋引擎爬蟲會對每一個造訪的網頁拍攝一個快照 (Snapshot) 作為當前頁面的備份,如果你在搜尋引擎中發現有頁庫存檔的連結,你會在連結的結果中看到當時被搜尋引擎備份的頁面內容。搜尋引擎服務會透過這些頁庫存檔備份來進行頁面內容分析,做為判斷頁面內容與使用者所搜尋關鍵字的相關性,進而成為影響頁面 SEO 排名的因素之一。
除了搜尋引擎由於為了提供搜尋服務因此具有頁庫存檔的功能以外,也有一些純粹的頁庫存檔服務,例如非營利組織 Internet Archive 的 Wayback Machine 的目的是期望做網路世界的數位檔案館。以下我們列出幾種常見搜尋引擎查看頁庫存檔的方法:
A. 在 Google 搜尋引擎結果中查看頁庫存檔
如果你想要在 Google 搜尋引擎結果中查看網頁的頁庫存檔,你可以在搜尋結果中找到你想要查看的網頁後,點擊在搜尋結果網址旁的 ⋮ 圖示後會跳出「近一步暸解這項結果」的視窗,如果該頁面有頁庫存檔的話,你會在最下方找到「頁庫存檔」的按鈕連結。
B. 在 Google Search Console 中查看頁庫存檔
如果你有將你的網站加入到 Google Search Console (GSC),那麼你也可以使用 GSC 的網址檢查工具 (Inspection Tool) 來查看頁庫存檔。使用的方法是進入到 GSC 的資源後,在上方的網址輸入框輸入你想要查看的網址,要注意只能輸入屬於你這個資源下的網址,無法查看非當下資源的網址。詳細的操作步驟可以參考下圖:
C. 在 Bing 搜尋結果中查看頁庫存檔
想要在 Bing 的搜尋結果中查看頁庫存檔的方式與 Google 搜尋引擎類似,你可以在搜尋結果中點擊網址旁的箭頭,找到英文「Cached」或是中文「頁庫存檔」來查看頁庫存檔。詳細的操作步驟可以參考下圖:
D. 在 Yahoo 搜尋結果中查看頁庫存檔
想要在 Yahoo 的搜尋結果中查看頁庫存檔的方式與 Google 和 Bing 搜尋引擎類似,你可以在搜尋結果中點擊網址旁的箭頭,找到「頁庫存檔」來查看頁庫存檔。詳細的操作步驟可以參考下圖:
如何運用頁庫存檔幫助 SEO 優化?
SEO 行銷人員透過頁庫存檔進行 SEO 優化的常見方法有以下 5 種:
- 驗證最新內容是否更新到搜尋引擎資料庫中
- 研究競爭對手的內容歷史
- 找回消失的頁面資料
- 避免惡意抄襲的檢舉攻擊
- 要求不想被 Google 索引的內容
A. 運用頁庫存檔驗證新內容是否有更新到搜尋引擎資料庫中
搜尋引擎爬蟲機器人需要訪問過你的網頁、解析過你的頁面內容,你的網頁才有可能被加入搜尋引擎的索引,最終就有可能顯示在搜尋引擎的搜尋結果中。如同最一開始我們提到頁庫存檔是搜尋引擎訪問過後做的紀錄,因此我們可以透過頁庫存檔來得知搜尋引擎何時訪問過我們的網頁,是否有將我們最新的內容更新到搜尋引擎的資料庫。你可以透過查看頁庫存檔的時間戳記,以及內容來辨別搜尋引擎爬蟲是在哪一個時間點來訪問你的頁面以及它看到什麼樣的網頁內容。
延伸閱讀:認識 Google 搜尋引擎及運作方式,掌握演算法的秘密增進網站 SEO 排名
對於操作 SEO 的人員來說,網站的更新如果能夠即時被搜尋引擎更新收錄是相當重要的,除了將網址加入網站地圖 (Sitemap) 以外、透過主動提交索引網址期望加快索引更新速度以外,能夠運用庫存檔驗證內容是否有更新到搜尋引擎資料庫中是基本功。
B. 運用頁庫存檔研究競爭對手的內容歷史
所謂知彼知己百戰百勝,你可以查看頁庫存檔保留的頁面資訊與競業現在頁面資訊差異來了解競爭對手做了哪些改動,如果競爭對手的 SEO 排名在近期有超越過你時,你可以透過這個方法來研究學習網頁文章內容的調整方向。比較困擾的是頁庫存檔是只有保留最近的一次,因此如果你想要研究更久以前的歷史紀錄時,你可以嘗試使用其他的頁庫存檔工具看看是否有機會找到。例如使用其他搜尋引擎的頁庫存檔或是使用一開始本文提到的 Wayback Machine 工具。
延伸閱讀:SEO 文章怎麼寫?關鍵字研究、議題、寫文案通通教給你!
C. 運用頁庫存檔找回消失的網頁資料
雖然比較少發生這樣的事情,但人生難免有些意外是網站的內容因為某些原因遺失了。此時你可以透過頁庫存檔來碰碰運氣看是否能夠撈回以前的資料。
D. 運用頁庫存檔來避免抄襲檢舉攻擊
Ranking 過去曾遭遇內容被抄襲,對方甚至提交版權申報到 Google 的惡意攻擊,並且因為 Google 加入 Lumen 研究計畫,被舉報抄襲的網站會直接公開,不僅導致我們許多排名第一的文章被 Google 下架、損失龐大流量,品牌聲譽更因此嚴重受損。
發生這樣的狀況,需要主動向 Google 申訴並證明自己是原創者,此時如果我們在每次內容更新時都主動提交到前面提及的 Wayback Machine 這樣具有公信力的頁庫存檔服務,就有具備效力的證據可以證明自己的清白、保護努力經營的網站不受惡意攻擊的傷害。
E. 要求 Google 刪除你的頁庫存檔
有時我們可能有些內容不想要被 Google 索引,但忘記加上 robots.txt 或是 noindex 而不小心被索引。或是我們有些使用外部工具例如 Hackmd 時忘記加上不公開的選項而導致被索引。此時你可以主動向 Google 提交移除請求,如果該內容是在你管轄的網站下,那麼你可以透過 Google Search Console 提交請求,但如果該內容不屬於你的管轄網站,那麼你可以到這邊要求從 Google 搜尋中移除過時內容。
以上是針對頁庫存檔的介紹和用於 SEO 優化的常見方法,希望大家閱讀文章之後對頁庫存檔 web cache 更加理解,也可以試試使用上述的方法進行 SEO 操作,提升搜尋結果排名的同時也為網站做好護城河!
SEO 行銷專家|Ranking SEO
Ranking 樂於向大眾分享 SEO操作心法,推廣數位行銷的核心概念,作為SEO行銷的專家品牌,Ranking 將 AI 智能應用結合SEO行銷,推出相關工具及服務,為眾多品牌帶來實質效益!不只提供網站 SEO 健檢與關鍵字探索服務,找出熱門的目標關鍵字,還能使用 SEO 內容規劃工具檢核文章優化程度,為你提升網站的關鍵字強度,進而獲得更佳的 Google 搜尋排名位置。
Ranking 提供的服務
SEO專案服務 幫助企業客戶完整健檢網站品質,改善不足的部分,透過網站安全性、網站使用體驗、網站檢索與索引、搜尋與社群預覽、內容分析等6大面向的操作,解決企業客戶投入大筆預算,卻始終看不到實際成效的痛點。Ranking更提出6個月將網站提升至Google搜尋首頁的服務保證,讓你的網站擁有高流量,進而帶來實際銷售量!