影響網(wǎng)站收錄的18個因素
發(fā)布者: 華企立方 發(fā)布時間:2016-6-25 11:19:18
搜索引擎抓取流程
索引擎蜘蛛爬行的過程是這樣的,首先檢測網(wǎng)站的robots.txt文件,確定哪些內(nèi)容禁止抓取,哪些內(nèi)容允許抓取等信息,確定robots.txt允許爬取之后,進入我們網(wǎng)站的首頁,然后通過首頁的鏈接爬取到我們網(wǎng)站中的內(nèi)容頁或者欄目頁,之后再通過欄目頁到達我們的文章頁。
既然已經(jīng)知道了搜索引擎抓取我們網(wǎng)站的流程,那么我們接下來七七就要為您分析影響搜索引擎抓取的因素了,首先
1、網(wǎng)站速度的影響
機房問題、dns問題、cdn加速問題、服務(wù)器帶寬、服務(wù)器硬件、操作系統(tǒng)、服務(wù)器軟件以及服務(wù)器所安裝的程序,這些都有可能影響我們網(wǎng)站的打開的速度。
2、nofollow標簽的合理使用
nofollow是一個HTML標簽的屬性值。這個標簽的意義是告訴搜索引擎”不要追蹤此網(wǎng)頁上的鏈接”或”不要追蹤此特定鏈接。那么我們所要做的就是,用nofollow來屏蔽掉網(wǎng)站頁面重復(fù)出現(xiàn)的鏈接以及對seo沒有很高價值的頁面,以減少網(wǎng)站權(quán)重的分散,并且可以減少搜索引擎重復(fù)抓取網(wǎng)站內(nèi)每個頁面的重復(fù)鏈接,以提高搜索引擎抓取效率。
3、網(wǎng)站硬盤問題:如在服務(wù)器里面安裝多個虛擬機,導(dǎo)致硬盤轉(zhuǎn)速變慢,有時會導(dǎo)致搜索引擎打不開網(wǎng)站。
4、返回碼問題:比如同一個鏈接返回不同的返回碼,又或者404頁面返回200等
5、安全軟件問題:比如開啟了防火墻規(guī)則、屏蔽了網(wǎng)站端口、開啟防采集規(guī)則、開啟防攻擊規(guī)則等,導(dǎo)致了搜索引擎同一時間由于大量訪問網(wǎng)站,而導(dǎo)致被安全軟件攔截。
6、外鏈問題:
我們發(fā)外鏈的目的有兩個,一個是吸引搜索引擎來抓取我們網(wǎng)站(引蜘蛛)另外一個就是提升網(wǎng)站的排名。外鏈首先要保證不能單純的指向首頁,要把外鏈做到指向欄目頁、文章頁的都有一些。
另外做外鏈的時候一定要考慮一下幾個因素:多樣性、集中性、平衡性、相關(guān)性、準確性、高質(zhì)量性、人文性等。
7、網(wǎng)站的權(quán)重
網(wǎng)站權(quán)重是搜索引擎對這個網(wǎng)站信任度的一個體現(xiàn),如果網(wǎng)站的權(quán)重夠高,那么搜索引擎抓取的也相應(yīng)的會比較及時,反之則是網(wǎng)站權(quán)重低,搜索引擎對其信任度不高,也許蜘蛛會很久來訪問網(wǎng)站一次,相應(yīng)的抓取頻率就很低了。
8、網(wǎng)站地圖
網(wǎng)站地圖是將網(wǎng)站的所有連接,最直觀的反應(yīng)給搜索引擎,可以提高搜素引擎的抓取效率,同時也為增加網(wǎng)站的收錄提供了良好的幫助。
9、推廣
網(wǎng)雜很難前期的推廣也非常重要,前期推廣包含QQ群推廣、QQ空間推廣、郵件推廣、軟文推廣、論壇外鏈推廣、平臺信息推廣。所有能引導(dǎo)來用戶點擊的推廣都可以,當然一定要是良性的推廣。因為有點擊就會給予點擊權(quán)重,而網(wǎng)頁是具有一定權(quán)重以后才會被收錄。
10、pr
pr值是谷歌使用的衡量網(wǎng)站質(zhì)量的一套標準,但是pr對于百度seo來說作用是非常小的,只是能夠給我們提供一個參考價值,但是相對的來說pr的價值并不是很大,比如我的七七seo博客pr是0,但是絲毫不影響我網(wǎng)站的排名能力。
11、url靜態(tài)化
URL靜態(tài)化的目的是有利于網(wǎng)站的排名,雖然現(xiàn)在搜索引擎已經(jīng)可以收錄動態(tài)地址,但是在在排名上靜態(tài)化的頁面比動態(tài)頁面更有優(yōu)勢, 并且URL靜態(tài)化將更有利于增加搜索引擎的信任度。但是,如果網(wǎng)站真的做不了靜態(tài)化的話,那就盡量使用短的url并且url中盡量少的使用動態(tài)參數(shù)。如果你的是動態(tài)的url,做法請參考(www.qiqqiseo.com)可以看到,url是很短的,只有一個變量。
12、url的唯一性
網(wǎng)站中的同一個頁面,只對應(yīng)一個url地址;如果網(wǎng)站上多種url都能訪問到同樣的內(nèi)容的話,那么就會出現(xiàn)以下問題:
a、搜索引擎會選一種url為標準,可能會和正版不同
b、用戶可能為同一網(wǎng)頁的不同url做推薦,多種url形式分散了該網(wǎng)頁的權(quán)重
建議:
a、如果你的網(wǎng)站上已經(jīng)存在多種url形式,建議按以下方式來處理:在系統(tǒng)中只使用正常形式url,不讓用戶接觸到非正常形式的url
b、不把session id、統(tǒng)計代碼等不必要的內(nèi)容放在url中
c、不同形式的url,301永久跳轉(zhuǎn)到正常形式防止用戶輸錯而啟用的備用域名.301永久跳轉(zhuǎn)到主域名
d、使用robots.txt禁止百度蜘蛛抓取你不想向用戶展示的形式
13、ulr帶關(guān)鍵詞
盡量在url中帶上網(wǎng)站的關(guān)鍵詞(拼音),這樣會在排名上面稍微的會占據(jù)一點因素,要知道百度是中文搜索引擎,對拼音的分析能力是很強大的。
14、代碼因素
網(wǎng)站的代碼要符合w3c的標準,結(jié)構(gòu)層、表現(xiàn)層、行為層標簽都應(yīng)該完整,建議使用開源程序。如:我的博客使用的wordpress程序。
15、head信息的正確性
網(wǎng)站的三大標簽:標題標簽(title)、關(guān)鍵詞標簽(keywords)、描述標簽(description)
16、內(nèi)容的原創(chuàng)性
前面有說到原創(chuàng)的內(nèi)容一定會被收錄,只不過是時間的問題而已,不論哪個搜素引擎,都是喜歡原創(chuàng)的內(nèi)容,網(wǎng)站內(nèi)容的原創(chuàng)性直接關(guān)系到搜索引擎對你網(wǎng)站的信任度,信任度又可以通過權(quán)重這個參考來反應(yīng)出來,所以,網(wǎng)站內(nèi)容的原創(chuàng)性是網(wǎng)站優(yōu)化的重中之重。
17、內(nèi)容的重復(fù)度
轉(zhuǎn)載、或者是采集的文章,頁面的文字、頁面都和之前頁面一樣,具有非常高的重復(fù)度,那么百度就會計算你和其他網(wǎng)站內(nèi)容的重復(fù)度,搜索引擎是一個喜新厭舊的家伙,如果每次你所發(fā)的內(nèi)容重復(fù)度都很高的話,那么漸漸地蜘蛛就會失去對你網(wǎng)站的興趣。
18、網(wǎng)站的結(jié)構(gòu)
網(wǎng)站結(jié)構(gòu)混亂,內(nèi)鏈系統(tǒng)雜亂無章也會導(dǎo)致收錄緩慢。比如不同欄目的內(nèi)容互相做鏈接,而有的內(nèi)容鏈接很多另一些內(nèi)頁鏈接很少。網(wǎng)站的層次也是一個原因,對于一般的企業(yè)站點三層已經(jīng)足夠放置所有的內(nèi)容,而如果層次太深會影響內(nèi)頁的收錄。
更多資訊來源于:佛山網(wǎng)站建設(shè)2800kj.cn
此文關(guān)鍵字: