來源:黑帽工具網(wǎng)
要使網(wǎng)站對搜索引擎爬行器友好還應(yīng)在網(wǎng)站信息架構(gòu)(InformationArchitecture)上多加考慮。精心設(shè)計的架構(gòu)能夠為用戶和搜索引擎帶來很多好處。
1合乎邏輯、以分類為基礎(chǔ)的信息流的重要性
搜索引擎在理解你的網(wǎng)站時面臨大量的技術(shù)難題。爬行器無法像人那樣感受網(wǎng)頁,因此在可訪問性和索引上都有著明顯的局限。合乎邏輯、構(gòu)造合理的網(wǎng)站架構(gòu)有助于克服這些問題,在搜索流量和可用性方面帶來很大的好處。
網(wǎng)站信息架構(gòu)的核心原則有二:可用性——也就是使網(wǎng)站容易使用;信息架構(gòu)——為內(nèi)容設(shè)計一個符合邏輯的層次結(jié)構(gòu)。
信息架構(gòu)早期倡導(dǎo)者之一RichardSaulWurman在他的《InformationArchitects》(GraphisInc.)一書中作了如下定義:
信息架構(gòu)師。1)組織數(shù)據(jù)固有模式、澄清復(fù)雜概念的人。2)創(chuàng)建信息結(jié)構(gòu)或者映射,幫助其他人找到通往知識之路的人。3)21世紀的新興專業(yè),應(yīng)對以清晰性、人類理解以及信息組織科學(xué)為中心的時代需求。
可用性和搜索友好性
搜索引擎試圖重建人們按照質(zhì)量排序相關(guān)網(wǎng)頁的過程。如果真人來做這個工作,可用性和用戶體驗無疑會在確定排名中起很大的作用。考慮到搜索引擎是機器,它們無法輕易地分辨出這一指標,所以被迫采用多種替代方案和輔助指標來協(xié)助這一個過程。其中最有名的是鏈接度量(見圖6-3),組織良好的網(wǎng)站最可能得到鏈接。
從20世紀90年代末Google誕生以來,搜索引擎力求分析Web鏈接結(jié)構(gòu)的各個側(cè)面,它們擁有通過鏈接推斷信任度、質(zhì)量、可靠性和權(quán)威性的杰出能力。如果你深入研究網(wǎng)站之間存在鏈接和鏈接所在位置的原因,就能看到幾乎總是由一個人(如果是機構(gòu),則可能是幾個人)負責鏈接的創(chuàng)建。
搜索引擎推測,高質(zhì)量鏈接將會指向高質(zhì)量內(nèi)容,提供良好內(nèi)容和正面用戶體驗的網(wǎng)站得到的回報是比內(nèi)容和用戶體驗都很差的網(wǎng)站得到更多的鏈接。在實踐中,這種理論得到支持。現(xiàn)代搜索引擎已經(jīng)能夠很好地將高質(zhì)量、高可用性的網(wǎng)站放在查詢排名的最前面。
一個類比
我們來看看標準的文件柜是如何組織的。你有一個單獨的文件柜,上面有幾個抽屜,抽屜中放入文件夾,公文包在文件夾里,而公文包中包含多個文檔(見圖6-4)。
2網(wǎng)站架構(gòu)設(shè)計原則
規(guī)劃網(wǎng)站時要記住一點,幾乎每個用戶開始時并不知道去哪里、做什么以及如何找到他想要的內(nèi)容。網(wǎng)站的架構(gòu)如果認識到這種困難,利用熟悉的可用性標準建立直觀的鏈接結(jié)構(gòu),就有可能帶來正面的網(wǎng)站訪問體驗。精心組織的網(wǎng)站架構(gòu)有助于解決這些問題,為用戶和搜索引擎提供語義和可用性的好處。
正如圖6-6所示,一個菜譜網(wǎng)站可以使用智能的架構(gòu),滿足訪問者對內(nèi)容的期望,創(chuàng)建正面的瀏覽體驗。這個結(jié)構(gòu)不僅能幫助人們更輕松地瀏覽網(wǎng)站,還能幫助搜索引擎看到,你的內(nèi)容與邏輯概念分組融為一體。你可以用這種方法幫助產(chǎn)品應(yīng)用和產(chǎn)品屬性獲得好的排名。
盡管網(wǎng)站架構(gòu)只占算法的一小部分,搜索引擎還是利用主題之間的關(guān)系,為以合理的方式組織的內(nèi)容增加價值。例如,如果在圖6-6中你在不正確的分類中隨機地加入子頁面,排名就會受到影響。搜索引擎通過爬行Web的豐富經(jīng)驗,發(fā)現(xiàn)主題架構(gòu)中的模式,并獎勵堅持直觀內(nèi)容流向的網(wǎng)站。
設(shè)計網(wǎng)站架構(gòu)
盡管網(wǎng)站架構(gòu)(網(wǎng)站主題層次結(jié)構(gòu)和流程的創(chuàng)建)通常是信息架構(gòu)師的領(lǐng)域,不需要公司內(nèi)部內(nèi)容團隊的幫助,但是,從長遠看來,它對搜索引擎排名的影響是很顯著的,因此遵循基本的搜索友好原則是明智的。
如果按照下面的簡單方法進行,這一過程本身應(yīng)該不會太難:
1.列出所有必需的內(nèi)容頁面(博客文章、文章、產(chǎn)品詳情頁面等)。
2.創(chuàng)建足以包含網(wǎng)站各個類型詳細內(nèi)容的頂級導(dǎo)航。
3.反轉(zhuǎn)傳統(tǒng)的自頂向下過程,從詳細內(nèi)容開始,向上創(chuàng)建一個能夠涵蓋每個頁面的組織結(jié)構(gòu)。
4.理解底層之后,填補中層的內(nèi)容。增補子導(dǎo)航機構(gòu),使其合理地將頂級頁面和詳細內(nèi)容聯(lián)系起來。在小網(wǎng)站中,可能不需要這一個層次,但是在較大的網(wǎng)站中,可能需要2~3級子導(dǎo)航。
5.加入輔助性頁面,如版權(quán)、聯(lián)絡(luò)信息和其他非實質(zhì)性內(nèi)容。
6.構(gòu)建展示網(wǎng)站所有頁面的視覺層次(至少包括最后一級子導(dǎo)航)。
圖6-7展示了結(jié)構(gòu)化網(wǎng)站架構(gòu)的一個例子。
分類結(jié)構(gòu)
搜索引擎爬行Web時搜集了大量(數(shù)百萬GB)有關(guān)語言結(jié)構(gòu)、主題、內(nèi)容之間關(guān)系的數(shù)據(jù)。盡管從技術(shù)上講這不是人工智能方面的嘗試,但搜索引擎已經(jīng)構(gòu)建了能夠根據(jù)常見模式做出復(fù)雜判斷的知識庫。如圖6-8所示,搜索引擎蜘蛛能夠在爬行幾千個覆蓋相關(guān)主題(在例子中,是狗)的網(wǎng)頁時學(xué)習(xí)語義關(guān)系。
雖然內(nèi)容并不一定總是按照最容易預(yù)測的模式構(gòu)造,尤其是不同的分類方法能夠為訪問者帶來價值或者興趣的時候,但是從邏輯上組織主題對人類(他們會發(fā)現(xiàn)你的網(wǎng)站更容易使用)和搜索引擎(能夠根據(jù)主體相關(guān)度的提高而提升你的排名)來說都是有幫助的。
主題相關(guān)性。這種基于相關(guān)性的計分模式很自然地從文件之間的單一關(guān)系擴展到網(wǎng)站的整個分類結(jié)構(gòu)。網(wǎng)站創(chuàng)建者可以構(gòu)建從寬泛主題流向更詳細特定內(nèi)容的層次結(jié)構(gòu),充分利用這一模式。很顯然,在任何分類系統(tǒng)中都有主觀性。不用過分沉迷于完善引擎所看到的內(nèi)容,而要首先想到你的訪問者,并以此為指導(dǎo)方針,確保在項目中不會濫用你的創(chuàng)意。
分類學(xué)和本體論
在網(wǎng)站設(shè)計中,你還應(yīng)該考慮分類學(xué)和本體論。分類學(xué)實際上是網(wǎng)站架構(gòu)的二維層次模型。可將本體論看做人類對某主題領(lǐng)域思維的映射方式,它比分類學(xué)更復(fù)雜,因為涉及的關(guān)系類型可能更多。
找出本體的有效方法之一是卡片分類(cardsorting)。這是一種用戶測試技術(shù),要求用戶將相關(guān)項集中到一起,以便你盡可能直觀地組織網(wǎng)站。卡片分類不僅能幫你識別通往網(wǎng)站最具邏輯性的路徑,還能夠幫助你分辨多義性或者晦澀的術(shù)語。
運用卡片分類的方法是,將所有主要概念寫在一組卡片上,這些卡片的數(shù)量足以讓參與者閱讀、操作和組織。測試人員按照他們認為最有邏輯性的順序擺放卡片,并且按照合適的方法分類。
建立本體不是黑帽SEO的一部分,但是如果你能夠正確地進行這一工作,對網(wǎng)站的結(jié)構(gòu)會產(chǎn)生影響,從而影響到黑帽SEO。分類和本體對于建立正確的網(wǎng)站架構(gòu)來說缺一不可。
3扁平架構(gòu)與縱深架構(gòu)
搜索友好性有一條很嚴格的規(guī)則,就是創(chuàng)建扁平的網(wǎng)站架構(gòu)。扁平網(wǎng)站要求用最少的點擊數(shù)訪問任何指定網(wǎng)頁,而縱深式的網(wǎng)站訪問詳細內(nèi)容需要使用很長的鏈接路徑。對于絕大多數(shù)少于10000個頁面的網(wǎng)站來說,從首頁或者網(wǎng)站地圖頁面開始,應(yīng)該最多用三次點擊就能訪問到所有的內(nèi)容。在每個頁面有100個鏈接的情況下,即使有幾百萬個網(wǎng)頁的網(wǎng)站,采用合適的鏈接和導(dǎo)航結(jié)構(gòu),也能在5~6次點擊內(nèi)訪問每個頁面。如果網(wǎng)站不是扁平的,找到想要的內(nèi)容可能需要很多次點擊,如圖6-9所示。相反,扁平網(wǎng)站(見圖6-10)使用戶和搜索引擎花費少數(shù)幾次點擊就能找到大部分內(nèi)容。
扁平網(wǎng)站不僅使搜索引擎更容易爬行;對用戶來說也更加簡單,因為它們限制了用戶達到目的所需要訪問的頁面數(shù),也就降低了放棄率,促進了重復(fù)訪問。
創(chuàng)建扁平網(wǎng)站時要注意,搜索引擎對從指定頁面爬行的鏈接數(shù)是有限制的。前面已經(jīng)提及,幾個主流搜索引擎的代表都曾經(jīng)說過,如果頁面包含100個多個鏈接,除非頁面特別重要(也就是說,許多外部網(wǎng)站鏈接到該頁面),否則搜索引擎可能不會跟蹤所有鏈接。
現(xiàn)在,這個問題已經(jīng)沒有那么嚴重,因為搜索引擎能夠處理更大的頁面尺寸和更多的頁面鏈接。但是,仍然有其他的理由支持避免在每個頁面上放置過多鏈接,比如,過多鏈接可能帶來潛在的可用性問題。
頁面中鏈接數(shù)量的問題與網(wǎng)站架構(gòu)的另一條規(guī)則相關(guān):盡可能避免過多使用分頁。分頁(pagination)是創(chuàng)建一系列網(wǎng)頁,以分解長的元素列表或者長文章的一種方法(例如,有些電子商務(wù)網(wǎng)站用分頁來處理無法在一個頁面上顯示的產(chǎn)品目錄),在許多方面這種方法都是值得懷疑的。
首先,分頁提供的相關(guān)性是視覺上而不是主題上的。其次,分頁可能導(dǎo)致重復(fù)內(nèi)容的問題或者被看做低質(zhì)量內(nèi)容的象征。最后,分頁可能造成蜘蛛陷阱,大量不相干的低質(zhì)量頁面可能不利于搜索可見性。我們很快將討論解決分頁問題的方法。圖6-11展示了分頁的一個例子。
所以,要確保實施扁平結(jié)構(gòu),堅持每頁鏈接數(shù)的合理原則,同時保持有上下文關(guān)聯(lián)度的鏈接結(jié)構(gòu)。這并不總像聽起來那么簡單,在某些網(wǎng)站上,構(gòu)建上下文關(guān)聯(lián)的結(jié)構(gòu)可能需要相當多的思考和規(guī)劃。想象一個銷售10000種男士跑鞋的網(wǎng)站。為該網(wǎng)站定義最優(yōu)的結(jié)構(gòu)可能需要很長時間的努力,但是這一努力能夠帶來很好的回報。
根據(jù)網(wǎng)站的內(nèi)容,分頁問題有很多不同的解決方案。下面是一些可能的方案,以及適合的場合。
1.創(chuàng)建一個View-All(查看全部)頁面,并使用rel=”canonical”屬性。你可能有一些冗長的文章,需要分解成多頁。但是,這會造成對頁面的鏈接錨文本是“1”、“2”、“3”這樣的形式。不同頁面的標題可能沒有明顯的差別,因此各個頁面將會相互競爭搜索流量。最終,如果有人鏈接到這篇文章卻沒有鏈接到第一頁,這個鏈接的權(quán)重將會浪費。
處理這個問題的方法之一是維持文章的分頁版本,同時創(chuàng)建文章的單頁版本,這個版本稱為View-All頁面。然后從分頁版本的各頁中使用canonical標記指向View-All頁面。這將把所有鏈接權(quán)重和搜索引擎的注意力集中到單一頁面上。還應(yīng)該在分頁版本中的各個頁面上加入指向View-All頁面的鏈接。但是,如果View-All頁面因為尺寸的原因加載速度太慢,這種方法可能就不是最佳選擇。
2.使用rel=”next”和rel=”prev”元素。在2011年9月的SMXEast會議上,Google的MaileOhye宣布Google支持新的鏈接元素rel=”next”和rel=”prev”。使用這些鏈接元素的好處是讓Google知道何時遇到了一系列分頁頁面。Google找到這些標記之后,指向其中任何一個頁面的鏈接將被當成指向全系列頁面的鏈接。此外,Google將在索引中說明該系列中相關(guān)度最高的頁面(大部分時候是第一個頁面,但并不總是如此)。
雖然在本書編著期間,必應(yīng)還沒有宣布支持這些標記,但是很可能在不遠的將來會這么做。這些標記可以用于通知Google有關(guān)分頁結(jié)構(gòu)的信息,不管是否創(chuàng)建View-All頁面,都可以使用它們。概念非常簡單。下面的例子概述了如何在分為12頁的內(nèi)容上使用這些標記:
a.在分頁內(nèi)容第一頁的<head>部分,用一個rel=”next”標記指向內(nèi)容的第二頁,如:
b.在分頁內(nèi)容最后一頁的<head>部分,用一個rel=”prev”標記指向內(nèi)容的倒數(shù)第二頁,如:
c.在第2~11頁的<head>部分,用一個rel=”next”和一個rel=”prev”標記分別指向下一頁和前一頁。下面是第6頁中的標記:
還要注意一點,如果采用了一個View-All頁面而沒有采用這些標記,Google將試圖發(fā)現(xiàn)該頁并且在搜索結(jié)果中代替分頁的版本。但是,本書作者建議使用上面的某個解決方案,因為Google不能保證發(fā)現(xiàn)你的View-All頁面,最好提供盡可能多的線索。








