10月26日,由百度站長平臺和MADcon聯(lián)合舉辦的百度站長平臺高端SEO俱樂部第一期沙龍活動圓滿落幕。
一.頁面收錄問題
1、404頁面問題:
Q:當(dāng)我們由于變更產(chǎn)生404之后,百度會間隔多長時間識別出來?并且需要識別幾次才會將其刪除?對有些尚未做好的專題頁面,可能會臨時設(shè)置為404頁面,之后很快將頁面恢復(fù),但這些專題頁面中有一部分很快就能夠恢復(fù),還有一部分就需要很長時間才可被收錄,因此有重大新聞時,會緊張重大專題被及時收錄的情況。
lee:不會有固定的時間,會根據(jù)網(wǎng)頁的和所在頻道的更新頻率,去確定刪除的時間,未做好或者非作為死鏈的頁面,盡量不要用404的返回碼,希望盡可能用503的返回碼,這樣spider能夠比較好的去識別。
2、時效性問題
Q:目前百度收錄上的時效性對百度和站長來說是雙贏,但對每年定期舉行的重大事件(例金鐘節(jié)),在固定時間能否將這種事件的權(quán)重或算法進(jìn)行優(yōu)化?
lee:這方面如果目前沒有做到的話,搜索團(tuán)隊(duì)會盡可能的去完善這方面的體驗(yàn),也會去通過一些工具的形式、協(xié)議等簡單的方式,提高這種體驗(yàn),去實(shí)現(xiàn)頁面的及時更新。
Q:對一些新聞,編輯可能后期需要對新聞的標(biāo)題進(jìn)行修改,但百度網(wǎng)頁收錄的更新很慢,較長時間無法將頁面進(jìn)行更新。
lee:像網(wǎng)頁換title 理論上應(yīng)該是要及時去更新,但目前做的還不太到位。
3、301跳轉(zhuǎn)問題的解決情況
lee:百度站長平臺會盡快上線關(guān)于301跳轉(zhuǎn)的工具,并會推出網(wǎng)站改版工具。
4、圖片、flash較多,文字內(nèi)容較少的的頁面的收錄問題:
Q:目前很多頁面可能會沒有很多的文字,比較多圖片和flash,對沒有很多文字的頁面,搜索引擎能很好的將這個頁面中的資源識別出來嗎?
lee:目前在推一個工具,將spider抓取日志展示出,去看下是否符合站長的抓取意愿,且對某些js較多的網(wǎng)站,假設(shè)目前收錄不好,可先盡量減少js的使用。
5、對一個網(wǎng)站數(shù)量較多的同一類型的頁面收錄量達(dá)到一定值之后,收錄量就會增加的很緩慢
Q:比如:人人日志,上千萬的數(shù)據(jù),用了一年多的時間目前收錄了幾百萬,且大部分內(nèi)容都是很高質(zhì)量的,但收錄量到一個值之后,就沒有增加,這個是什么原因?
lee:人人之前有一些頁面比較封閉,這兩年才開始開放,但是spider根據(jù)之前的日志分析,對人人網(wǎng)的改動反應(yīng)偏慢,所以推出了sitemap,希望大家通過sitemap將大家想進(jìn)行索引的數(shù)據(jù)進(jìn)行主動推送。
Q:姓名類的產(chǎn)品,通過sitemap提交之后,上千萬的數(shù)據(jù)還是收錄了700w+,會不會被認(rèn)為這些頁面是相似的頁面。
lee:互聯(lián)網(wǎng)資源很多,相似的產(chǎn)品很多,由于資源有限,會盡可能優(yōu)先選取有價(jià)值的頁面去抓取。一次提交的頁面量很大,搜索引擎需要一定的時間去收錄,搜索引擎可能會每天設(shè)置一定的壓力上線去抓取,避免對站長產(chǎn)生太大的壓力,可以嘗試使用百度站長平臺的抓取壓力調(diào)節(jié)工具調(diào)試自己網(wǎng)站的抓取壓力,增加壓力,我們這邊可以適當(dāng)提高自己的壓力加快抓取。
這里只是沙龍對關(guān)于頁面一些問題的解答,這次沙龍對SEOER們真是一頓“豐盛的大餐”。
文章由2800kj.cn整理發(fā)布
微信公眾號搜索
"佛山華企立方"