長期以來,不斷有人問我,為什么有的網(wǎng)站被收錄的頁面多,有的網(wǎng)站收錄得少。為什么某個關(guān)鍵詞有的網(wǎng)站會排第一,有的網(wǎng)站會排在幾十頁以后。。。等等,這些問題看似簡單又有著復(fù)雜的算法,于是不知道某位高人提出了“權(quán)重”這個說話,當(dāng)然我不是反對,但是我認(rèn)為,“權(quán)重”這兩個字太籠統(tǒng)。今天我就來談?wù)劙俣鹊囊恍┧惴ā?/p>
今天,我首先在這里高調(diào)地提出“百度積分”一說。
無論是技術(shù)上還是人性化管理上,搜索引擎對網(wǎng)站的收錄數(shù)量和排名,都是通過積分來管理的。也就是說,誰的積分多,誰的權(quán)重就高。
積分的大概算法是:原創(chuàng)文章加分,采集扣分,關(guān)鍵詞堆砌扣分,色情、反動內(nèi)容都扣分。
具體加多少,扣多少,我想只有他們內(nèi)部幾個人知道了。
下面我就來模擬一下百度的積分制度:
1、做一個新站,通過采集的方式在短時間內(nèi)發(fā)布1萬篇文章,當(dāng)百度蜘蛛程序來訪時,會把所有內(nèi)容都收錄入存,每篇文章加一分,于是site時,會發(fā)現(xiàn)收錄了大量頁面。
2、在接下來的幾天里,百度就會將該站的內(nèi)容在百度數(shù)據(jù)里進(jìn)行分析對比(一個有著N個網(wǎng)站N條內(nèi)容的龐大數(shù)據(jù)庫)。如果某些(內(nèi)容)文章在數(shù)據(jù)庫里已經(jīng)存在,那么就扣分,為了鼓勵原創(chuàng)和懲罰采集,扣的分比加的分要多,我們就假設(shè)扣2分。
3、當(dāng)這個站的數(shù)量為0或者少于0時,那么在百度里就SITE不到這個站了,這就是我們常說的被K。
======================================
現(xiàn)在我們就來論證一下上面的模擬(假設(shè))
1、百度數(shù)據(jù)庫的存在: 我們經(jīng)常發(fā)現(xiàn),搜索某個關(guān)鍵詞時,顯示的頁面內(nèi)容與實(shí)際可能不相同,那是因?yàn)榘俣仁珍浐?,該頁面又進(jìn)行了修改,那么搜索結(jié)果肯定來自百度的數(shù)據(jù)庫了。
2、加分、扣分,一個小的網(wǎng)站(內(nèi)容不多)被K后,能在短的時間同讓他重新收錄,因?yàn)榭梢酝ㄟ^發(fā)表原創(chuàng)文章不斷加分,當(dāng)積分大于0時,又能SITE到了。 如果是一個大的站(幾萬以上的采集內(nèi)容)被K后,解封可能要一年甚至好幾年的時間。相信這樣的經(jīng)歷大部分站長都有過吧。
當(dāng)大家看到這里時,先停下來,仔細(xì)回憶一下自己的經(jīng)歷和經(jīng)驗(yàn),結(jié)合我的“百度積分制”,是不是明白了很多?
現(xiàn)在說說百度的關(guān)鍵詞積分了。
關(guān)鍵詞的積分制和收錄積分制是不一樣的。但是關(guān)鍵詞的排名肯定也需要通過一個積分公式來進(jìn)行排名,積分高的排前面,積分低的排后面。
影響這個積分的因素主要有域名(URL)、關(guān)鍵詞密度、頁面結(jié)構(gòu)、內(nèi)容質(zhì)量等。
域名(URL):比如在搜索“電影”時,URL或域名中包含“dianying”“movie”的就會排前一些。
頁面結(jié)構(gòu):搜索引擎在抓取頁面時,是按從上到下,從左到右的順序來的,如果他抓了大半天,還沒有抓到關(guān)鍵詞,那估計(jì)排名也就很靠后了(提示:現(xiàn)在知道為什么圖王會在admin5的最左上方放著“站長必上的網(wǎng)站”幾個字了吧)。
關(guān)鍵詞密度和內(nèi)容質(zhì)量更不用多說了,網(wǎng)上相關(guān)的介紹有一大堆,我就不重要這些。
申請創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!