3億站點被打擊,百度開出“救命藥”——最新網(wǎng)站數(shù)據(jù)生產(chǎn)指南!
前幾天,全網(wǎng)的站點基本99%都在降權(quán) 、降詞,用百度官方的話說,不展現(xiàn)、不召回、不索引,在百度一陣痛打后,百度又給咱們的站長送上了“救命藥”——網(wǎng)站數(shù)據(jù)生產(chǎn)指南,鼓勵你如何正確生產(chǎn)優(yōu)質(zhì)資源數(shù)據(jù)。
以下內(nèi)容從2??個方面去講解:
一、抓取到展現(xiàn)中間發(fā)生了什么?
二、數(shù)據(jù)生產(chǎn)建議
一、抓取到展現(xiàn)中間發(fā)生了什么?
抓取到展現(xiàn)其實是個復(fù)雜的篩選過程,從網(wǎng)站——鏈接——網(wǎng)頁——索引——搜索,這其中也有鏈接篩選、網(wǎng)頁篩選、索引篩選,剛好我最近看了關(guān)于搜索召回的內(nèi)容,這里就簡單舉個例子,用戶a搜索一個關(guān)鍵詞“seo怎么做?”,那么備選資源有1000條,搜索引擎通過多路召回、比如相似度搜索召回等,取出500條進行粗排、細排等,這其中會涉及到向量嵌入、tf-idf等,感興趣的大伙可以自己找資料學習下,別總是網(wǎng)站被打擊了,還整天只會吹水。
二、數(shù)據(jù)生產(chǎn)建議
數(shù)據(jù)生產(chǎn)誤區(qū)
1、鏈接越多越好
2、內(nèi)容/關(guān)鍵詞越多越好
3、倒流越多越好
4、收錄不維護
其中這4條很好理解,我總結(jié)一下,一個站點并不是頁面越多越好,只要做到精而美就夠了,另外用一些作弊手法進行導流,尤其是被懲罰的站點導流也是不允許的。
生產(chǎn)資源建議
鏈接生產(chǎn)方面:
1、首頁鏈接
建議官網(wǎng)認證,并且網(wǎng)站內(nèi)容完善后才上線為佳。
2、站內(nèi)鏈接
避免動態(tài)帶變化參數(shù)無效鏈接,比如url=?&1214.html等,避免自動化批量生產(chǎn)內(nèi)容,換句話說,用ai生產(chǎn)低質(zhì)內(nèi)容無效了,尤其是偽原創(chuàng)、同義詞替換等。
3、主域內(nèi)規(guī)范建站
避免主域名下站點泛濫,比如頂級域名做娛樂等,二級域名又做其他類型的站。
4、合理使用站平入口
關(guān)于資源提交,優(yōu)先使用api提交工具。(文章附帶api自動提交工具,適合所有類型的站)
內(nèi)容生產(chǎn)
1、首頁
網(wǎng)站tdk符合seo規(guī)范,內(nèi)容美觀、精美
2、內(nèi)容建議
聚焦生態(tài)類型,精而優(yōu),內(nèi)容邏輯清晰、段落層次分明、用戶閱讀體驗好,同時注重排版、豐富度以及頁面整體質(zhì)量。
3、內(nèi)容應(yīng)避免
tdk避免堆砌,不使用采集、避免拼湊、重復(fù)內(nèi)容,另外,同一服務(wù)器下或不同服務(wù)器不同模版相同內(nèi)容站點,可以歇菜了。之前一些站長關(guān)心的相同模版、不同內(nèi)容應(yīng)該沒事,但不同模版、相同模版就有問題了,站長們要多注意一下。
4、保障頁面功能、避免消費障礙
網(wǎng)站自帶功能如查詢、播放、購買、下載等交互功能,保證基礎(chǔ)用戶體驗。
資源導流
違規(guī)的導流會傳遞負向特征,如果跟無關(guān)、無價值頁面,會因為導流關(guān)系受到打壓,如關(guān)聯(lián)站點降級等,比如a網(wǎng)站被整體降權(quán),站長想用b網(wǎng)站救活a網(wǎng)站,采取了b站301到a站,或b站掛a站廣告、鏈接等,都會受到牽連。
注意事項
我們在做站點都時候,注意配置好301/302,以及https的友好型,另外避免使用第三方?jīng)]有質(zhì)量保障的cdn服務(wù)商,如果有開發(fā)能力的話,建議開通小程序,wise/pc端做好適配,robots規(guī)范書寫,最后就是定期安檢,避免被黑,強烈建議生產(chǎn)長尾資源,依據(jù)長尾關(guān)鍵詞去生產(chǎn)數(shù)據(jù),至于具體怎么做,詳細參考我的另外一篇文章。
每次百度直播課,只要是工程師一出面,基本上都是干貨滿滿,總結(jié)這次百度出的網(wǎng)站數(shù)據(jù)生產(chǎn)指南,其實也是在為以后站長指明了一條路,那就是,好好做優(yōu)質(zhì)內(nèi)容,別整天想著走捷徑,不然就跟今天一樣,站被拔毛了都沒人心疼一下。
最后,結(jié)合站長常見的問題,整理了一些答案,請各位站長對照:
q:原創(chuàng)內(nèi)容收錄了,過幾天又不見了?
a:資源有進場 也就有退場,內(nèi)容一般因為時效性問題以及內(nèi)容質(zhì)量下降導致,個人建議這種情況在原來內(nèi)容上改一下,然后提交,如果可以,也可以刪除。
q:很多站長質(zhì)疑每次在站長資源平臺上得到的反饋都是機器人回復(fù),要么就是丟個白皮書鏈接,這樣有用嗎?
a:白皮書內(nèi)容是產(chǎn)品、運營辛苦總結(jié)的經(jīng)驗,看白皮書不是說只看表面,要理解的去看。
q:最近收錄異常到底怎么回事?
a:收錄存在一定周期才能識別,具體還要看索引和流量情況,如果有異??商峤环答?。我個人的看法就是,百度官方最近更新導致搜索結(jié)果異常,當然這些異常官方肯定不認的。
q:采集內(nèi)容怎么處理?