2010年12月20日 星期一

淺析網頁收錄步驟

最近百度似乎在做一些更新調整,很多站長抱怨百度收錄困難!甚至在尋找了大量鏈接後百度都不收錄你的站,是不是百度真的不願意收錄新站呢? 可能確實做了一些調整,但是應該是站長方法不對。下面我給大家講講搜索引擎收錄過程,並且用一個案例來說明怎麼讓百度更快的收錄你的網站。

搜索引擎收錄過程:

抓取網頁
每個獨立的搜索引擎都有自己的網頁抓取程序(spider)。 Spider順著網頁中的超鏈接,連續地抓取網頁。 由於互聯網中超鏈接的應用很普遍,理論上,從一定範圍的網頁出發,就能蒐集到絕大多數的網頁。

處理網頁
搜索引擎抓到網頁後,還要做大量的預處理工作,才能提供檢索服務。其中,最重要的就是提取關鍵詞,建立索引文件。 其他還包括去除重複網頁、分析超鏈接、計算網頁的重要度。

提供檢索服務
用戶輸入關鍵詞進行檢索,搜索引擎從索引數據庫中找到匹配該關鍵詞的網頁;為了用戶便於判斷,除了網頁標題和URL外,還會提供一段來自網頁的摘要以及其他信息。

這是摘自<<搜索引擎系統學習與開發實踐總結>>的一段總結:首先蜘蛛讀取抓取站點的URL列表,取出一個站點URL,將其放入未訪問的URL列表(UVURL列表)中,如果UVURL不為空剛從中取出一個URL判斷是否已經訪問過,若沒有訪問過則讀取此網頁,並進行超鏈分析及內容分析,並將些頁存入文檔數據庫,並將些URL放入已訪問URL列表(VURL列表),直到UVRL為空為止,此時再抓取其他站點,依次循環直到所有的站點URL列表都抓取完為止。

如何更快被百度收錄:

先給大家看個成功案例當天建立的網頁當天被收錄。最快有個域名我當天晚上7點多才註冊的,更晚些時候就被收錄了,我給大家一個方法,大家可以按照此方法做:      

建立一個單頁面,從百度百科找一段關於網站關鍵詞的介紹,再去其他地方找另外一種介紹。如網站做SEO,就找SEO在百科的解釋,再去維基百科找找seo的介紹,二者結合拼湊成一個單頁面;

單頁面命名為index.htm或者default.htm,成為網站的首頁。 再去百度的登錄入口去登錄一次你的網站。

無需任何外部鏈接,最多兩天后你將在搜索引擎看到你的網站在當天就被收錄了!比如你27日登錄的,雖然百度可能27日就收錄了你的站,但是你可能需要再過一兩天才能看到被收錄。

以上方法我已經測試了數十個域名,屢試不爽。 收錄後再改版你的網站吧

最後給大家一些收錄的建議:

收錄前就把首頁title的關鍵詞定義好,避免更改關鍵詞太快,引起搜索引擎反感

主動去登錄你的網站,而不需要急著去找任何外部鏈接(新站的目標是被收錄)

安裝好搜索引擎工具條

單頁面文件不要太長太大,100K以內最好

隨時關注收錄情況,去搜索新站的網址或者site一下

沒有留言:

張貼留言