最近很多朋友都收到過“百度站長平臺:請及時清理歷史sitemap文件”的郵件了吧,不過這次比較特殊大部分人都是受到了信息,百度出算法都沒有給我們發(fā)過短信,這個發(fā)了短信為什么?因為要清除我們這邊的數(shù)據(jù),怕誤刪,以此提醒,下面代代SEO就為大家詳細講下這個是什么意思,我們站長應(yīng)該如何應(yīng)對。
百度原文郵件提示:
尊敬的搜索合作伙伴:
您好!為了提升站點新資源的處理效率,避免舊數(shù)據(jù)過多造成站點數(shù)據(jù)抓取與處理異常,請于11月9日之前盡快刪除超出站點配額的歷史sitemap文件(包括普通收錄與死鏈數(shù)據(jù))。如到期未處理,系統(tǒng)將統(tǒng)一刪除。感謝您的關(guān)注與支持!
這則消息主要表達的意思就是:如果你是一個老網(wǎng)站,在長周期運營的過程中,如果自己提交了大量的sitemap地圖文件,超出了百度搜索資源匹配的給到的配額,我們最好合理性的選擇去刪除一部分,否則截止到規(guī)定時期,系統(tǒng)可能會自動從最早的開始刪除。其中,代代提醒大家:核心目的主要是:節(jié)省網(wǎng)站匹配的數(shù)據(jù)提交資源,目的是希望站長把現(xiàn)有的配額分配到給網(wǎng)站有價值的目標URL。
什么是歷史sitemap文件!
這個文件就是我們網(wǎng)站地圖,提交到百度的站長平臺去引導(dǎo)收錄,這個是以前的收錄方法,現(xiàn)在很少人在用這個技術(shù),因為百度后來出了智能推送,自動推送,快速收錄和普通API推送這類。所以sitemap,使用的人并不多,只不過之前很多人使用,使用后,一直存在在站長平臺也沒有刪除。所以引發(fā)了百度的持續(xù)抓取,浪費抓取量,也會誤判一些網(wǎng)站,值得注意的是,百度還提到配額問題,每個網(wǎng)站可以提交sitemap配額都是不同的,有的是10000,有的是10萬,這個目前沒有準確查詢接口,不過可以通過普通提交配額可以進行估算。
什么是誤判網(wǎng)站?
代代SEO舉個例子,加入這個網(wǎng)站是5年前被人在運營的,上傳提交了很多sitemap,然后一直在保留,等你接手以后哪,就直接運營了,內(nèi)容被你改了,很多以前的內(nèi)容都丟失了,但是站長平臺還有很多以前的sitmap,索引數(shù)據(jù),百度一樣會去抓取,當百度識別里面的鏈接80%都是死鏈,無法訪問的時候,很容易降低你當前站點的評分,從而引發(fā)降權(quán),這個大家了解吧。
百度的用意!
這個我們不得不說,sitemap,很多人提交了以后,就不管了,其實sitemap是有一定生效周期的,如果抓取過了,就沒有必要去持續(xù)提交了,如果我們的站長平臺都保留大量的sitemap,百度會浪費很大一部分的抓取量,在抓取的時候很容易出異常,畢竟有很多鏈接是不存在的,所以會造成網(wǎng)站排名波動,或者百度數(shù)據(jù)庫的異常情況,所以刪除對我們站長,和百度都有好處,我也是比較支持百度這樣去做。
最后代代SEO要說一下,如果你發(fā)現(xiàn)百度抓取率較低,你可以使用sitemap,或者網(wǎng)站層級比較多的情況下,但是提交一個月以后,如果百度那邊提示抓取數(shù)量和你sitemap數(shù)量差不多的時候,就要刪除,重新提交新的,這個是目前比較正確的做法,一般新站提交sitemap,或者層級超過3級別的網(wǎng)站提交的比較多,但是目前主流的做法是直接去用API提交每一條鏈接,效果會更加快速一些,好了,就講解到這里吧。
文章來源:代代SEO博客
來源地址:https://www.daidaiseo.com/seoan/10930.html
申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!