百度站長(zhǎng)平臺(tái)后臺(tái)有個(gè)索引量,如果你的索引量為10,但用site命令會(huì)發(fā)現(xiàn)網(wǎng)站只收錄了6頁,這就表示剩下4頁索引還需要時(shí)間審查,至于什么時(shí)候放出來,需要綜合考量,比如頁面內(nèi)容質(zhì)量,網(wǎng)站速度,重復(fù)內(nèi)容等等。
簡(jiǎn)單來說,就是有索引只是代表網(wǎng)頁鏈接被百度數(shù)據(jù)庫接收了,但是不一定會(huì)被正式收錄,如果提交的頁面鏈接不符合標(biāo)準(zhǔn),索引會(huì)減少,但是一旦索引量穩(wěn)定了,就早晚會(huì)放出來收錄,只是時(shí)間問題。
新站往往會(huì)有一個(gè)考察期,建議新站上線后使用百度站長(zhǎng)平臺(tái)的新站保護(hù)功能(站點(diǎn)屬性),可以加快收錄,注意只有國內(nèi)的服務(wù)器才能享受到這個(gè)福利,不能填寫備案號(hào)的網(wǎng)站沒有資格,哭~~~~
百度搜索資源平臺(tái)提交鏈接分四大方式:主動(dòng)推送、自動(dòng)推送、sitemap、手動(dòng)推送。
最為快速的提交方式,百度的主動(dòng)推送是為了讓大家推送最新產(chǎn)生的網(wǎng)頁,而不是不斷提交相同的舊網(wǎng)頁,這樣可以縮短百度爬蟲發(fā)現(xiàn)你站點(diǎn)新鏈接的時(shí)間,使新發(fā)布的頁面可以在第一時(shí)間被百度索引,但索引不代表收錄放出網(wǎng)頁了。
一般推送以后的內(nèi)容1-5天才會(huì)出現(xiàn)在快照中。如果你的網(wǎng)站質(zhì)量較高,或者你的網(wǎng)站屬于新聞資源類型的網(wǎng)站,一般主動(dòng)推送后內(nèi)容是可以立刻就出現(xiàn)在搜索引擎結(jié)果中的。郁悶的是我發(fā)現(xiàn)一些采集新聞的新站居然排名可以比老站高,這個(gè)就不知道后期會(huì)不會(huì)進(jìn)入沙盒了。
主動(dòng)推送支持多種途徑:比如curl 、post、php以及ruby等。而且支持一次性提交多條網(wǎng)站頁面地址,不過每個(gè)站點(diǎn)每天可推送的次數(shù)有限制。wordpress網(wǎng)站一般使用PHP方式推送(制作一個(gè)PHP文件放入根目錄)。
百度官方認(rèn)為:主動(dòng)推送是最為快速的提交方式,只要你一更新文章,站點(diǎn)就會(huì)將當(dāng)天新產(chǎn)出鏈接立即通過此方式推送給百度,以保證新鏈接可以及時(shí)被百度收錄。
自動(dòng)推送是在網(wǎng)站安裝百度自動(dòng)推送JS代碼(JS代表是所有程序都兼容的)。
當(dāng)你每次發(fā)布文章后,只要第一時(shí)間訪問一下文章頁面,即可在前臺(tái)觸發(fā)推送機(jī)制,將最新文章推送給百度頁面URL將立即被推送給百度。
雖然百度說支持主動(dòng)推送和自動(dòng)推送代碼配合使用,二者互不影響。但我保持懷疑,因?yàn)橛兄貜?fù)提交的問題,基本選擇一種就可以了。
Sitemap是將網(wǎng)站的要提交給百度所有鏈接集合起來,就是制作一個(gè)Sitemap文件,然后將Sitemap提交給百度。百度會(huì)每周抓取檢查你提交的Sitemap,對(duì)其中的鏈接進(jìn)行處理,但收錄速度慢于主動(dòng)推送。
比如你的文章寫完了,漏了主動(dòng)推送,雖然做了自動(dòng)推送,但是某一篇文章卻沒有被訪問到,就不能及時(shí)地被百度抓取了。如果想要無遺漏的快速被百度抓取,sitemap就起到作用了。
百度Sitemap協(xié)議支持三種格式:文本格式、xml格式、Sitemap索引格式,可以根據(jù)自己情況來選擇任意一種格式組織sitemap.
對(duì)鏈接提交有問題的網(wǎng)頁,可以使用百度站長(zhǎng)平臺(tái)的抓取診斷工具進(jìn)行排查,看看到底哪里出了問題。
注意:這些推送的內(nèi)容僅僅是進(jìn)入了百度搜索的數(shù)據(jù)庫中,是否會(huì)在搜索結(jié)果中顯示還需要百度爬蟲的進(jìn)一步檢測(cè)和處理。
以上4種方法,雖然百度是提倡多種鏈接推送同時(shí)使用,互為補(bǔ)充,意思是如果我們用不同的方式同時(shí)推送了一條鏈接,百度可以給你去重后顯示。
但實(shí)際我嘗試的時(shí)候,發(fā)現(xiàn)每次同時(shí)提交完,第二天就掉收錄了,同一篇文章,重復(fù)多次推送,可能會(huì)讓百度蜘蛛誤認(rèn)為你的這篇文章更新頻繁,文章不穩(wěn)定等而進(jìn)入收錄沙盒期,造成短時(shí)間內(nèi)得不到展示。而且經(jīng)常重復(fù)提交頁面舊鏈接,鏈接配額將會(huì)下調(diào),并可能失去主動(dòng)推送功能的權(quán)限。
熊掌號(hào)里有一個(gè)天級(jí)收錄,一般給每個(gè)站點(diǎn)的配額是有限制的,每天10條。
如果網(wǎng)站中有哪些鏈接還未被百度收錄,可以通過天極收錄提交給百度,前一天提交的鏈接,一般第二天就被百度收錄了,但有時(shí)候狂跌,可能跟重復(fù)提交有關(guān)系。
網(wǎng)站收錄禁忌
網(wǎng)站速度慢、不穩(wěn)定,經(jīng)常出現(xiàn)無法打不開或連通異常的狀況。需要使用穩(wěn)定的服務(wù)器。
新站上線短期內(nèi),只新增更新內(nèi)容就行了,不要去改動(dòng)以前的內(nèi)容,特別是標(biāo)題,搜索引擎對(duì)標(biāo)題很敏感,以免延長(zhǎng)新站考核時(shí)間,并不給收錄,當(dāng)網(wǎng)站索引趨于穩(wěn)定狀態(tài)后可以適當(dāng)改動(dòng)
robots文件不要禁止太多項(xiàng)目,不要禁止收錄圖片,注意要加入制作網(wǎng)站站點(diǎn)地圖Sitemap.xml,這樣可以加快收錄。
搜索引擎對(duì)收錄沒有文字的圖片和視頻有短板,搜索瀏覽器搜索到的是你首頁的標(biāo)題,接著才通過你的導(dǎo)航系統(tǒng)搜索到你網(wǎng)站的其他內(nèi)頁,如果圖片、視頻則不能達(dá)到這個(gè)效果。
網(wǎng)站內(nèi)容不要出現(xiàn)重復(fù),同樣的話題不要多次編輯,網(wǎng)站頁面不要留空頁,不要大量采集和復(fù)制別人的內(nèi)容,盡量保持原創(chuàng),形成良性循環(huán)。加強(qiáng)網(wǎng)站內(nèi)鏈建設(shè),多發(fā)高質(zhì)量文章。
利用友情鏈接或者錨文本鏈接來引蜘蛛,防止網(wǎng)站成為孤島頁面。
沒有外鏈會(huì)延長(zhǎng)爬蟲爬取網(wǎng)站并收錄的時(shí)間,所以要弄些高質(zhì)量的外鏈來來加速網(wǎng)站收錄。(順道說一句,知乎的外鏈已經(jīng)不被收錄了,只適合引流推廣)
注意:不要搞亂七八糟與網(wǎng)站無關(guān)的外鏈,外鏈在精不在多,優(yōu)質(zhì)的外鏈不僅能引流,還能促進(jìn)蜘蛛爬取。短時(shí)間內(nèi)如果網(wǎng)站產(chǎn)生大量垃圾外部鏈接,會(huì)觸發(fā)百度的“綠蘿算法”,延長(zhǎng)網(wǎng)站考核期,甚至K站。
本文由今科科技用戶上傳并發(fā)布,今科科技僅提供信息發(fā)布平臺(tái)。文章代表作者個(gè)人觀點(diǎn),不代表今科科技立場(chǎng)。未經(jīng)作者許可,不得轉(zhuǎn)載,有涉嫌抄襲的內(nèi)容,請(qǐng)通過 反饋中心 進(jìn)行舉報(bào)。
售前咨詢:0760-2332 0168
售后客服:400 830 7686
1998~2024,今科26年專注于企業(yè)信息化服務(wù)
立 即 注 冊(cè) / 咨 詢
上 線 您 的 網(wǎng) 站 !