當前位置:首頁 >  站長 >  網站運營 >  正文

遇到百度網站抓取異常怎么辦

 2021-02-18 16:05  來源: 白楊seo   我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領券再下單

大綱如下:

1、抓取異常是什么?百度抓取異常又是什么?

2、百度抓取異常的原因有哪些?

3、網站抓取異常的原因有哪些?

4、百度抓取異常對網站有什么影響?

5、網站出現抓取異常的解決方法

抓取異常是什么?百度抓取異常又是什么?

所謂抓取異常,就是指搜索引擎蜘蛛無法抓取網站頁面,網站出現的抓取異常就是抓取異常,具體原因是什么下面會講到。

百度抓取異常是什么?簡單理解就是百度的蜘蛛(baiduspider)無法正常抓取,就是百度抓取異常。如上圖,來源網上。9月3號,百度蜘蛛來抓取時,抓取時連接超時2次。

百度抓取異常的原因有哪些?

百度抓取異常的原原因主要分兩大類,一是網站異常,二是鏈接異常。在哪里看呢,在百度搜索資源平臺(https://ziyuan.baidu.com)你添加后數據統(tǒng)計—抓取異常那里,如下圖。

網站異常原因:

1、dns異常

當百度蜘蛛(Baiduspider)無法解析您網站的IP時,會出現DNS異常??赡苁悄?網站IP地址錯誤 ,或者 域名服務商把Baiduspider封禁了 。

可以用WHOIS或者host查詢自己網站IP地址是否正確而且可以解析,如果不正確或無法解析,與域名注冊商聯(lián)系,更新網站IP地址。

2、連接超時

抓取請求連接超時,可能原因是: 服務器過載 或 網絡不穩(wěn)定。

3、抓取超時

抓取請求連接建立后,下載頁面速度 過慢 ,導致超時??赡茉蚍掌鬟^載, 帶寬不足 。

4、連接錯誤

無法連接或者連接建立后對方服務器拒絕。

鏈接異常原因:

1、訪問被拒絕

爬蟲發(fā)起抓取,httpcode返回碼是403。

2、找不到頁面

爬蟲發(fā)起抓取,httpcode返回碼是404。

3、服務器錯誤

爬蟲發(fā)起抓取,httpcode返回碼是5XX

4、其他錯誤

爬蟲發(fā)起抓取,httpcode返回碼是4XX,不包括403和404。

關于上面提到的403、404、4XX、5XX等,其實都是網站HTTP狀態(tài)碼,如果不清楚同學,可以看這一篇: 白楊SEO:SEO入門學習之搜索引擎(百度)蜘蛛與網站HTTP狀態(tài)碼 ,再學習一下。

網站抓取異常的原因有哪些?

網站抓取異常的原因主要有以下五個方面:

1、服務器異常

服務器連接異常最大的可能是網站服務器過大,超負荷運轉,通過檢查瀏覽器輸入你的域名是否正常訪問。服務器異常會導致蜘蛛無法連接網站服務器,導致出現抓取失敗。

2、域名過期

域名過期網站肯定不能訪問,域名解析就會失效了。如果存在這類情況,你可以與你域名注冊商聯(lián)系解決,看是否被搶注,還是可以續(xù)費回來。

3、網絡運營商異常

電信和聯(lián)通這兩種都是屬于網絡運營商,蜘蛛無法訪問的網站。

如果是因為電信或聯(lián)通網絡運營商出現問題,與網絡服務運營商聯(lián)系或者購買CDN服務。

3、robots.txt文件設置問題

robots.txt的功效主要是一些不重要的文件屏蔽掉告訴搜索引擎這些些頁面可以不抓取,但也可能會存在把重要的頁面也給屏蔽了,可以檢查下robots文件設置。

關于ROBOTS.TXT,可以看我之前寫的這篇里面有寫到:

白楊SEO:新人學習SEO常遇到的15個SEO術語,建議收藏

4、死鏈接因素

原本正常的鏈接后來失效了就是死鏈接,死鏈接發(fā)送請求時,服務器返回404錯誤頁面。 死鏈的處理方案可以通過百度站長平臺提交死鏈文件。

5、網站被掛馬

網站被掛馬,要查詢掛馬文件在哪里并刪除。恢復網站,更改登錄名和密碼,安全密保要從新設置,防止下次被掛馬。如果找不到,建議直接更換整個建站程序,換一個程序。

百度抓取異常對網站有什么影響?

如果網站上存在大量內容蜘蛛無法正常抓取,百度搜索引擎會認為網站給用戶的體驗上有缺陷( 訪問網站的用戶沒有得到想要的東西,用戶的體驗感就會下降 )降低對網站的評價。

而且,網站在 抓取、索引、權重 上都會受到一定程度的負面影響,更嚴重的會直接影響到網站從百度獲取的流量。 所以,百度網站抓取異常是非常嚴重的,一旦發(fā)現,盡量解決。

如何解決呢,繼續(xù)往下看。

網站出現抓取異常的解決方法

1、出現5XX類型錯誤情況

出現這些情況,并不是網站本身向搜索引擎說自己5XX問題,有時打開還是正常的,那么站長后臺的為什么會顯示這個錯誤呢?

如果出現此類問題百分百是因為你的網站服務器造成,而對于某一個狀態(tài)碼的含義,比如503,直接交給技術來進行解決。如果技術還是解決不了,那么建議更換一家服務器。

2、抓取出現DNS錯誤情況

很多SEO新人發(fā)現網站打不開了就會馬上找網站服務商,但是吧,域名DNS服務器有可能也會出現問題。當網站出現問題后,比如打不開,第一時間應當確定到底是什么問題?

如果是域名的DNS問題,那么白楊SEO建議更換DSN。因為有些DSN出現了這個問題,它后面還有可能出現。

如果要換,就要換大一點的DNS服務商,比如阿里云收購的萬網就不錯,畢竟大公司,穩(wěn)定性還可以的。

3、出現抓取超時問題

現在做SEO排名已經到了用戶為王時代,用戶如果不能在第一時間打開你網站的頁面,那么就會跳到其他網站上去。而搜索引擎蜘蛛呢,一樣的。如果無法第一時間抓取,就會出現抓取超時問題。

上面說過,這個抓取超時,大多都是因為帶寬不足,或者是網站頁面太大而引發(fā)的所以解決方法建議如下:

(1)、在不影響圖片質量的情況下,對大的圖片進行壓縮哈;

(2)、減少比如網站的JS腳本文件類型的使用,或者把一些JS進行合并;跟技術說清楚。

(3)、整個網站頁面長度進行控制,尤其是你的網站首頁。很多人網站首頁做了十來屏,一般用戶最多下拉三到五屏。越長,整個加載就會越久。

(4)、網頁的內鏈數量,一般一個頁面互相之間的內鏈數量建議不要超過500條哦,其實越多,蜘蛛都會去往下爬取,小網站基本沒這個問題。

總之,百度抓取網站異常這個問題,建議建站時找成熟的程序建站,同時,找像阿里云這樣的大的服務商。不要總想著省錢,淘寶隨便幾百建個站,找個不知名服務商,其實這樣得不嘗失的。

文章來源:白楊seo

來源地址:https://www.baiyangseo.com/blog/222.html

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
百度網站

相關文章

  • 百度回應今日頭條訴訟糾紛 百度對所有網站一視同仁

    對于與今日頭條的不正當競爭糾紛一案判決結果,百度表示“對此判決結果將提起上訴”此糾紛發(fā)生在2018年,在檢索收錄時百度爬蟲監(jiān)測到今日頭條的官網存在不穩(wěn)定狀態(tài)而自動對其進行了穩(wěn)定性異常標注。

  • 百度網站如何遞交 如何達到快速收錄的效果

    百度開放熊掌號功能旨在實現網站的原創(chuàng)保護,站長需要進行實名認證,網站必須在站長平臺驗證過才能實現綁定,當然網站需要被百度收錄,而且網站提交的內容需滿足質量高、原創(chuàng)兩大屬性,才會被百度快速收錄。

  • 揭秘百度網站快速排名的SEO優(yōu)化投票策略思維

    當外鏈對關鍵詞排名的效果越來越差時,很多小伙伴可能會失去優(yōu)化的方向,覺得SEO優(yōu)化已經走到了盡頭。事實上情況真的是這樣嗎?難道我們除了去做外鏈優(yōu)化就沒有其他方法了?答案肯定不是的。SEO優(yōu)化的方法有很多,外鏈只是參與投票的其中一部分,想要做好SEO優(yōu)化就必須做好全面的優(yōu)化工作,不要單單的在一棵樹上吊

  • 百度網站降權的幾個原因分析

    百度降權對大多站長來說,是很恐怖的事情,產品排名消失,收錄大量減少,快照停止更新,更嚴重被把毛,這些都是朋友們不想看到的結果,在推一把和度谷看到很多關于百度降權的問題,元創(chuàng)說幾點關于百度降權的幾種情況,有一些不是百度降權,大家明白后,不必那么擔心就是1,網站改版后快照不更新對一些網站改過版的朋友都遇

  • 百度網站推廣之三條重要核心方法

    網站運營是一個長期的戰(zhàn)爭,這要求我們要能用大量的時間了解所在行業(yè)中的用戶需求情況,通過百度搜索下拉菜單看看哪些內容是用戶最有需求的。在多看看同行的網站有沒有把這些需求在網站中體驗出來,如果沒有那就是我們的一個機會,我們把查看到的這些需求問題全都在網站上體現出這樣用解決用戶搜索的目的,才能使網站得到良

熱門排行

信息推薦