多語言網(wǎng)站是指所提供的內(nèi)容含有兩種以上語言的網(wǎng)站。多語言網(wǎng)站的例子包括:加拿大公司的網(wǎng)站有英文及法文版本,或是有關(guān)拉丁美洲足球的資訊同時提供西班牙文和葡萄牙文版本。
多地區(qū)網(wǎng)站是指明確鎖定不同國家/地區(qū)使用者的網(wǎng)站。某些網(wǎng)站既是多地區(qū)網(wǎng)站,也是多語言網(wǎng)站(舉例來說,一個網(wǎng)站可能會有美國和加拿大地區(qū)兩種版本,而加拿大地區(qū)的內(nèi)容又同時含有法文和英文版本)。
管理網(wǎng)站的多重地區(qū)版本
以下是一些提示,可供您確認(rèn)本地化的內(nèi)容是否出現(xiàn)在適當(dāng)語言的搜尋結(jié)果中。
確認(rèn)網(wǎng)頁的語言相當(dāng)明確
Google只會使用網(wǎng)頁上顯示的內(nèi)容來判斷網(wǎng)站語言。并不會使用任何語言代碼,例如lang屬性。您可以針對每個網(wǎng)頁的內(nèi)容和瀏覽項(xiàng)目使用單一語言,并避免將翻譯內(nèi)容與原文并排顯示,以協(xié)助Google正確地判斷網(wǎng)頁語言。如果以單一語言保留大部分內(nèi)容的同時,只翻譯網(wǎng)頁上的重復(fù)性文字(通常發(fā)生這種情況的頁面都含有使用者產(chǎn)生的內(nèi)容),則含有各種重復(fù)性語言的搜尋結(jié)果中,如果多次出現(xiàn)相同的內(nèi)容,就可能會留給使用者不好的印象。
使用robots.txt可以防止搜尋引擎檢索網(wǎng)站上自動翻譯的網(wǎng)頁。自動翻譯有時詞不達(dá)義,可能會被視為垃圾內(nèi)容。更重要的是,劣譯或呆板不順口的翻譯,可能讓網(wǎng)站的瀏覽者反感。
確認(rèn)各個語言版本都能很容易找到
將各個語言的內(nèi)容存放在不同的網(wǎng)址中。請不要使用Cookie 來顯示網(wǎng)頁的翻譯版本??紤]讓各種語言版本的網(wǎng)頁都能相互連結(jié)。這樣一來,瀏覽德文版網(wǎng)頁的法文使用者只需按一下連結(jié)就能連往適合他的語言版本。
避免自動判斷使用者所用語言并重新導(dǎo)引到該語言版本。這些重新導(dǎo)向動作可能會讓使用者(以及搜尋引擎) 無法檢視您網(wǎng)站的所有版本。
謹(jǐn)慎選擇網(wǎng)址
Google是根據(jù)網(wǎng)頁的內(nèi)容來判斷其語言,但是網(wǎng)址本身也能夠讓使用者判斷網(wǎng)頁內(nèi)容。例如,下列.ca網(wǎng)址的子網(wǎng)域或子目錄使用fr來表示其內(nèi)容為法文:http://ccxcn.ca/fr/vélo-de-montagne.html和http://fr.ccxcn.ca/vélo-de-montagne.html.
在網(wǎng)址中注明語言也能夠幫助您找出網(wǎng)站中多語言內(nèi)容的問題。
您可以翻譯網(wǎng)址中的文字,也可以使用國際化網(wǎng)域名稱(IDN)。請務(wù)必在網(wǎng)址中使用UTF-8編碼(事實(shí)上,我們建議盡量都使用UTF-8),并記得讓這些在連往這些網(wǎng)址時,以正確的逸出字元作為網(wǎng)址。
將網(wǎng)站內(nèi)容鎖定為針對特定國家/地區(qū)
如果Google 察覺到某個網(wǎng)站的目標(biāo)國家/地區(qū),就能夠利用此資訊來改善不同國家/地區(qū)的搜尋結(jié)果品質(zhì)。Google 通常會使用下列元素來判斷網(wǎng)站鎖定的目標(biāo)國家/地區(qū):
國家代碼頂層網(wǎng)域名稱?(ccTLDs)。這些名稱受限于特定國家/地區(qū)(例如,.de表示德國、.cn表示中國),因此對使用者和搜尋引擎兩者來說,是表示網(wǎng)站明確鎖定特定國家/地區(qū)的顯著指標(biāo)(有些國家/地區(qū)對于ccTLD的使用者有所限制,所以請務(wù)必先了解詳情)。我們也會將較少人使用的ccTLD (例如.tv、.me、etc.)視為gTLD,因?yàn)槲覀儼l(fā)現(xiàn)相較于以國家為目標(biāo)的代碼,使用者和網(wǎng)站管理員經(jīng)常認(rèn)為這些代碼更加普通(我們沒有完整的清單可記錄我們視為gTLD的ccTLD,因?yàn)檫@份清單會隨時改變)。查看Google的一般網(wǎng)域完整清單。
地理定位設(shè)定。您可以使用網(wǎng)站管理員工具中的指定國家/地區(qū)工具,向Google指定網(wǎng)站鎖定的目標(biāo)國家/地區(qū)。您的網(wǎng)站必須要有一般頂層網(wǎng)域名稱,才能這么做。但是,如果您的網(wǎng)站鎖定了多個國家/地區(qū),則請勿使用這項(xiàng)工具。例如,將介紹蒙特婁當(dāng)?shù)夭蛷d的網(wǎng)站設(shè)定以加拿大使用者為目標(biāo)就很有道理,但是將那些著重于法國、加拿大和馬利等法語使用者的網(wǎng)站,設(shè)定以加拿大使用者為目標(biāo),就不太合理。
注意:因?yàn)榈貐^(qū)性頂層網(wǎng)域(例如.eu 或.asia) 并非指定單一國家/地區(qū),所以Google 會將其視為一般頂層網(wǎng)域。
伺服器位置(透過伺服器的IP位址判定)。伺服器位置通常鄰近您的使用者所在地區(qū),也可能透露網(wǎng)站的目標(biāo)群眾所在。某些網(wǎng)站會使用分散式內(nèi)容傳送網(wǎng)路(CDN),或是將主機(jī)架設(shè)于網(wǎng)路伺服器基礎(chǔ)架構(gòu)較佳的國家/地區(qū),此時的位置就不具指標(biāo)意義。
其他指標(biāo)。其他有關(guān)您網(wǎng)站目標(biāo)群眾的線索來源還包括網(wǎng)頁上的當(dāng)?shù)刈≈泛碗娫捥柎a、是否使用當(dāng)?shù)卣Z言和貨幣、來自其他當(dāng)?shù)鼐W(wǎng)站的連結(jié)和/或是否使用Google我的商家?(如果有)。
Google不會使用位置中繼標(biāo)記(例如geo.position或distribution)或HTML屬性來進(jìn)行地理定位。
網(wǎng)址結(jié)構(gòu)
考慮使用網(wǎng)址結(jié)構(gòu),這可以讓您將網(wǎng)站內(nèi)容依照不同地理區(qū)域加以劃分。請參考以下表格,以便了解您可以選擇的方法有哪些:
網(wǎng)址結(jié)構(gòu) | 范例 | 好處 | 壞處 |
特定國家/地區(qū) | ccxcn.ie |
|
|
有g(shù)TLDS 的子網(wǎng)域 | de.ccxcn.com |
|
|
有g(shù)TLD 的子目錄 | ccxcn.com/de/ |
|
|
網(wǎng)址參數(shù) | site.com?loc=de |
|
|
地理定位并非100% 準(zhǔn)確,所以您必須設(shè)想,當(dāng)使用者瀏覽到錯誤的網(wǎng)站版本時,您應(yīng)該怎么做。在所有網(wǎng)頁上顯示連結(jié),讓使用者能夠自行選擇地區(qū)和/或語言,便是一種可行的作法。
重復(fù)的內(nèi)容和國際網(wǎng)站
有時候,這類針對不同地區(qū)提供特定內(nèi)容的網(wǎng)站,如果又同時提供了多種語言版本,便可能會在不同的網(wǎng)址上放置相同或類似的內(nèi)容。只要該內(nèi)容是針對不同國家/地區(qū)的使用者,通常就不成問題。雖然我們強(qiáng)烈建議針對各種不同族群的使用者提供不同的內(nèi)容,但是要做到這一點(diǎn)并不容易。一般來說,在robots.txt檔案中禁止檢索,或是使用"noindex"漫游器中繼標(biāo)記,就不需要「隱藏」重復(fù)的內(nèi)容。但是,如果您在不同網(wǎng)址上提供同樣的內(nèi)容給相同使用者(例如,如果ccxcn.de/和ccxcn.com/de/同時顯示了給德國使用者的德文內(nèi)容),就應(yīng)該選一個偏好的版本,并適當(dāng)?shù)剡M(jìn)行重新導(dǎo)向?(或使用rel=canonical連結(jié)元素)。此外,建議您按照rel-alternate-hreflang指南,確認(rèn)您已向搜尋資訊的使用者提供正確的語言或區(qū)域網(wǎng)址。
針對多語言網(wǎng)站,NC會采用同一網(wǎng)域、子資料夾、各別資料庫方式,或是不同網(wǎng)域、上層資料夾、各別資料庫。
當(dāng)采用不同網(wǎng)域規(guī)格時,我們可以提供美國HE主機(jī)、香港IBM主機(jī)、臺灣HINET主機(jī)、北京主機(jī)(需要搭配.cn網(wǎng)域跟主機(jī)備案)、英國主機(jī)。