前段時間增加了建站二級域名,原來博客站的主域名不帶www,把主域調整為www.yxrxyy.live之后,需要做幾個重要修改,否則權重就會分散,降低網站權重。分享血的教訓,讓新站長少走彎路。
本博客剛開始的時候主域是xiuzhanwang.com,但很多帶www的頁面被收錄,不想讓百度再抓取這些頁面,如何刪除呢?這讓秀站網秀站網相當煩惱。
重復收錄頁面的原因
1.動態內容已被抓取
百度蜘蛛會根據頁面的鏈接情況爬取并放出快照,如頁面內容調整或者刪除了,快照就較難刪除。
常見的有: /tag.php?/%CF%D6%B4%FA%BC%F2%D4%BC/ (tag標簽) /plus/list.php?tid=3 (dede動態列表) /plus/list.php?tid=85&zxfg=%CF%D6%B4%FA%BC%F2%D4%BC等 (dede篩選)
有的朋友說把那些頁面設置為404就好,參考文章《網頁404頁面制作及注意事項》但是已經被刪除的靜態頁面還好,動態頁面就沒辦法。建議新手采用靜態頁面的方式學習SEO。
2.仍存在相對路徑
相對路徑形式 /web/ (目錄) /seo/ (目錄) /images/logo.png /css/style.css 絕對路徑形式 http://www.yxrxyy.live/web/ (目錄) http://www.yxrxyy.live/seo/ (目錄) http://www.yxrxyy.live/images/logo.png (文件) http://www.yxrxyy.live/css/style.css (文件)
www.yxrxyy.live的實際上是二級域名(和m.xiuzhanwang.com是同等的權重),如果兩個域名都被抓取了,并且URL是相對路徑,百度蜘蛛會在兩個域名下重復抓取,放出的快照是有一些www,一些又沒有www。建議URL路徑采用絕對路徑的方式,即使被收錄了,久而久之也會慢慢的恢復,只是時間比較長。設置方法參考文章《什么是URL絕對路徑和相對路徑SEO優化重要環節》
3.突然改變主要域名
原主域名xiuzhanwang.com 修改為www.yxrxyy.live
90%以上的新網站都沒做好301,不然為什么還有這么網站需要優化呢?301原來用得比較多的是換域名,現在做網站SEO游湖是不可能找個新域名,地球人都知道老域名相對更容易些。
中途才做的301,舊快照消失經常持續幾個月不等,很明顯感覺排名受影響。百度蜘蛛經常對正常優化方法有延后性,但是對黑帽的卻響應及時得很...改變域名的影響參考文章《避免更換域名或改版帶來的損失降到最小》
4.中途才設置偽靜態
搜索引擎確實對靜態頁面有青睞,但每次都要生成,如果虛擬空間支持.htaccess的就能做偽靜態,形式如:
動態: http://www.yxrxyy.live/plus/list.php?tid=1 偽靜態: http://www.yxrxyy.live/list-1.html
秀站網已經寫了很多關于偽靜態的文章了,點擊查看偽靜態設置,一般偽靜態是后面進階優化的時候才做的,一般SEOer接手的網站都是較差的...這樣的情況解決起來比較棘手。
5.自帶的臨時三級域名被收錄
每個購買的空間都有一個臨時域名,其實被抓取臨時域名這樣的情況還是比較多見,所以在剛開始建站的時候用robots屏蔽全站,建設好了才讓蜘蛛抓取,解決的辦法只能是301。參考文章《什么是robots協議對seo的影響》
6.網站多次改版
一個網站剛開始的時候都會進行或多或少的調整,包括結構調整和內容調整等,有很多死鏈產生。拿到手的網站都比較差的原因,死馬當活馬醫的情況還是比較多,除非網站有上千個被收錄,這時死鏈比較影響權重。
一些情況較差的網站就可以調整后重新生成網站地圖,向百度提交死鏈。設置方法:網站地圖sitemap,如果是有規律的話可以提交網站改版,寫好改版規則即可,最終完成全部改版時間也是1-3個月不等。
刪除重復收錄的百度快照方法
1.閉站保護
找了很多網上資源,由于站內寫了比較多的.htaccess規則,比較麻煩,還是選擇百度工具的“閉站保護”功能,有朋友誤解為能刪除這些快照,其實這些快照不被人看到而已,還是存在索引。當然而且又一定的時間限制。
把不想被抓取的域名申請閉站保護,一般都會通過,也不需要讓頁面返回404,會在2小時左右閉站成功。
2.全部鏈接換成絕對路徑
不管被抓取的頁面如何,如果里面的路徑都是主要域名的路徑,權重也不會分散到哪里,蜘蛛就不會重復爬取頁面。
3.加大更新高質量原創文章
在做了必要的301重定向和絕對路徑修改之后,百度會進一步考察新域名的情況,這個時候一定要加大高質量的文章內容,這樣新域名和老域名的情況就有不同,蜘蛛會積極爬取,久而久之百度就停止老域名的抓取。
4.對已被搜索引擎抓取的頁面處理
靜態頁面直接向百度提交404就好, 針對某些動態頁面,比如搜索頁面、問答頁面等,這些如果被抓取了很有可能會影響我們網站的關鍵詞庫,方法有很多:
①聲明該頁面不建立索引,在源代碼</head>之前加
<meta name="robots" content="noindex">
②robots聲明不允許抓取;
③在頁面的<title><keywords><description>不調用任何搜索詞,動態搜索頁面是不那么容易被刪除的,前段時間還有萬網搜索讓黑客注入大量的垃圾信息,造成SEO排名下降,就是調用了這些搜索詞;
剩下的就是等搜索引擎進一步處理了,這時候應該多更新高質量內容吸引蜘蛛來爬取頁面。
本文地址:http://www.yxrxyy.live/seo/1586.html
發表評論
評論列表(條)