; V+ Y: w+ l A J 百度互联网创业俱乐部搜 0 T3 W4 u) W' Q( C# t4 D8 F$ |7 z9 v
索引擎优化指南
8 H; G6 c G4 j% I) M* G版本号:V1.0 ) }6 K+ m$ {8 J( \* R
@ Baidu 2010 1 M f* y. v, X
2 百度搜索引擎优化指南
6 }& f' H+ u) k g
/ b3 {5 F( A& D( K8 ~+ E4 g a : D9 [; V7 H1 B( e& T
3 S* n/ o$ i; I& G) d
前言
" b8 S0 Q/ y8 ^2 f, g. M% LSEO(Search engine optimization,搜索引擎优化),指为了提升网页在搜索引擎
! c( h7 |; ~& X1 m自然搜索结果中(非商业性推广结果)的收录数量以及排序位置而做的优化行为,这一行为 1 S1 H. k0 V; D* L9 s& `
的目的,是为了从搜索引擎中获得更多的免费流量,以及更好的展现形象。而SEM(Search 2 N4 V; {, [# z% c
engine marketing,搜索引擎营销),则既包括了SEO,也包括了付费的商业推广优化。 3 ]4 t, b: r! j# H
毋庸讳言,SEO 自从1997 年左右出现以来,就和搜索引擎处于某种对立状态。这种
) a7 b4 u+ H1 w. J6 i) |; F对立源于两方面: . E! `! H0 S: C! @
一方面,大量SEO 行为只考虑了如何获得更多的“免费”流量,至于多的这些流量是否 ' {& ~; {; [) U3 R5 b
符合搜索用户价值,则不在考虑范围之内。这种SEO 被称为“黑帽”,历来受到搜索引擎的
3 A$ m; X8 V( L7 s严厉打击。 " l! ~1 m' H: C0 _0 Z
另一方面,SEO 的目的是为了获取更多的“免费”流量,这和搜索引擎的商业推广是对立
9 {" Q* G2 A& I6 T4 G6 T的。所以很多SEO 的从业者,包括相当多的搜索引擎从业者,从心底里认为,两者的利益
+ Z$ A2 Z1 } s4 ~0 v就是不可调和的。 % b; S5 S5 l8 \
但如果从更加长远的角度来看,搜索引擎和SEO 从业者的利益,实际是有高度一致的
7 x `9 k; j- ]6 c6 H, e. V0 I7 ~地方的: " l& l& C9 y2 c4 x1 E& A" U! I2 W! x t( u
首先,搜索引擎的搜索质量改善,很大程度上受到资源形态的影响。比如很多优质资源, 1 y# U1 I3 H3 I7 X: c+ d
是用Flash 或者Ajax 做的,搜索引擎就无法很好的爬取和索引。搜索引擎无法独立承担起 , j( l" u" L8 g9 i* x
这个引导教育职责,有了SEO 参与其中,这些优质资源就可以更好的发挥其检索效果,改 ! h2 R! h, b e: t; D8 Z
善用户搜索体验。
7 ^/ F& ~, @' \3 B8 d7 o其次,SEO 从业者也是搜索引擎商业价值很好的布道者。尤其对于中国这样的新兴市
: |( R- }! R' N0 n, V场,传统的中小企业对于如何触网,如何做互联网营销,并无多少经验。SEO 在其中可以 7 V2 W3 _2 K1 s. F( S, L2 S
扮演非常重要的角色。而这种布道,对于搜索引擎产业价值的拓展,是很有好处的。
9 F* y. L9 N. d4 A6 C7 ?基于以上原因,我们需要重新审视搜索引擎和SEO 之间的关系。两者宜建立起一种更
& m- }+ R3 i+ G4 g/ w) C% H# E加良性的共生关系,驱逐劣币,提携良币,以使互联网生态圈得到更加健康有序的发展。百 . y. M% f# b" Q
度作为中文搜索领域的领导者,有责任和义务来推进这个事情。这也是本文档发布的初衷。
+ h+ b/ A5 [3 a, z. _* N3 o我们先来看一下过去的问题所在。 % A# p* Y+ p' Y0 ]3 y' X; ~, ^
(1) 黑帽SEO 大行其道,占据了SEO 主流话语权
* {. o) h( z/ s黑帽SEO 行为,通常就是一般所谓的“搜索引擎作弊”。利用和放大搜索引擎的策略缺
+ S3 y) t" n9 r- _陷(实际上完美的系统是不存在的)获取更多用户访问量。而这种更多的访问量,是以伤害
T" e+ i8 a! ~1 P9 \- y0 L3 百度搜索引擎优化指南
5 _) e4 |) G# J% Y% a- o: G, D) A+ c用户体验为代价的,而这会危及一个搜索引擎的生存基础。所以,面对这样的行为,如果短
% S0 M4 k( B6 w7 U5 m. ]期内无法修补系统,搜索引擎也会通过一些临时策略进行遏制以免事态的失控。在作弊领 5 Z, w+ i4 h3 P/ F' \+ n) R
域,破窗效应是非常明显的。 7 U6 ?3 [7 f+ e; P% T
很多人会说,整天说作弊作弊,到底哪些行为是作弊?这是无法穷尽的。互联网在动态
( w* z5 R' v7 Z4 t) c: G; ~( U的发展,搜索引擎也在动态的发展,作弊行为自然也是在动态的发展。最基本的界定法则, ( o# x$ H1 c& M4 {9 r/ L, t3 T* c
就是这个行为的泛滥,是否会影响搜索系统,最终伤害到用户的搜索体验。 4 i8 B4 |+ q( @. G2 a2 t ?2 Y
对黑帽SEO 行为放任不管,不仅会造成搜索引擎质量的下降,还会恶化互联网生态环
1 k! M/ r) }- l) N' C. y2 k" Y境,并使得良性的建站积极性受到打压,最终形成劣币驱逐良币的恶劣后果。在过去,黑帽 2 [, M' J- I* {: f- _; W9 h4 e& z
SEO 者面对惩罚,振振有词,甚至将搜索引擎告上法庭,这种状况,严重影响了正常的舆
+ ~5 g/ m4 D) O( q论氛围。这是我们必须要去扭转的。
; B: d' s4 o; {( i总之,搜索引擎和黑帽SEO 行为之间的矛盾,是不可调和的;过去如此,现在如此,
) b/ M! U. ]' N将来也一定如此。打击黑帽SEO,会始终是搜索引擎质量控制的关键环节之一。而营造黑
! Q% N7 D* r; u0 L" B帽SEO 者“老鼠过街,人人喊打”的舆论氛围,也是我们需要努力的目标。
+ C( D4 d7 A+ v* ?. k" X(2) 白帽SEO 行为得到的指引不够清晰 4 L" Y# z, v/ v0 ?
所谓白帽SEO,就是能起到改良和规范网站设计,使之对搜索引擎和用户更加友好,
- B7 Z3 n4 ]5 X, z, S并从中获取更多合理流量的优化行为。但过去的问题在于,我们过去较少的界定,什么样的
$ b- d# n) _% W q% s( S行为是推荐的。这导致很多白帽优化心存顾虑。
. A# ~5 U; ^, ?* V正是鉴于上述问题,百度决定提供更加公开化的白帽SEO 指南,营造更好的舆论氛围, 5 ^* Q x3 f. u3 Z8 d4 M
以使SEO 行业,有更加良性的发展。 . d Y! ?' z3 H; z
需要指出的是,我们所颁布的SEO 指南,虽然听取了众多站长的意见和建议,但离完
H5 i! F& }4 g; T- @6 h美仍有相当距离。所以,我们会通过“百度站长俱乐部”这个渠道, 收集更多的建设性意见,
4 Z% d2 O5 |& i9 a来不断的完善这一指南。
; T1 D- p" L6 I4 l Q4 百度搜索引擎优化指南
& m1 T7 a5 z2 _% F) \5 @/ L目录 ! G `% [3 K- {; \& ?& r) K& c% t, V
前言.. 2 ( G% k' x5 ?' b8 S
目录.. 4 : h: c% C" O. j) `8 B0 t
1 前期准备.................................................................................................................... 5
8 X6 O/ W) h% g, v1.1 域名注册.................................................................................................................... 5 7 m( l* ]" y8 f! ?8 z$ z
1.2 服务器、空间租用..................................................................................................... 5 ' i7 I7 g+ F$ O# u3 G' e" V0 d2 b
2 面向搜索引擎的网站建设.......................................................................................... 6 # m3 ?; K* U: I5 T+ i
2.1 良好收录.................................................................................................................... 6 ( T0 t0 N3 `" [+ A# p- Q6 m
2.2 良好排序.................................................................................................................. 11 ' i( Q, ~) I! ~1 a
2.3 良好展现.................................................................................................................. 13
% u5 [7 z' W2 i- e4 I3 网站运营.................................................................................................................. 15
9 @4 m: |; z6 k" T& i0 g3.1 目标=转化率............................................................................................................ 15
% B6 s, R1 z$ [* e$ O# {1 z+ R8 C$ G3.2 搜索引擎流量分析................................................................................................... 15 5 X4 Y: ~: g3 G& K0 ` p5 \2 @
3.3 网站信任度.............................................................................................................. 16 + e6 l& o5 j; ^. Y& b: R
3.4 不断强化品牌概念................................................................................................... 16
3 i7 Q& ]: ~- A# T0 n6 A4 作弊与惩罚.............................................................................................................. 16 9 D- g1 {2 n' @' h' h- e& i5 H
4.1 百度如何定义作弊................................................................................................... 16 - N4 w5 q) g$ \$ {; p2 X
4.2 作弊会受到怎样的惩罚............................................................................................ 18
$ z5 ^/ J8 ]3 A* G; c4.3 改正后能否解除惩罚? ............................................................................................ 18 ( M7 U6 u# W5 p* h, E1 u
5 联系与反馈.............................................................................................................. 18
6 f0 N' i4 d* B% V6 关于百度的十万个为什么........................................................... 错误!未定义书签。
, s. Q3 L, l/ ^1 Z l$ g5 百度搜索引擎优化指南 # R3 u; [# ]. X* D4 o1 M& R
1 前期准备
; R4 b% Z H c, j域名和服务器空间是网站建设的基础。
& i" |5 X3 T& z- Y+ T1.1 域名注册 2 n/ g; p/ f* Z
域名是用户对网站的第一印象,能否让用户迅速记住域名对网站发展非常重要。建议注
* P0 a T/ X& Q4 M& l册域名时选择容易让用户记忆、容易产生信任感的域名,这样可以提高回头率,并方便用户 : g/ Z" Z" r1 y$ r& R
推荐。
! G N4 p8 \2 d5 M: ]8 V( F(1) 域名尽量简短,越短的域名,用户的记忆成本就越低 4 ~% {4 o7 O$ I/ o! ~; R& [, P. j
(2) 域名可以和网站主题或网站名称相呼应,让人看到域名就能联想到网站内容,比如 - T: P) _$ U( G
使用公司名称、商标、网站名称或者公司产品等信息来选择域名 7 k/ `! r8 n$ L7 t1 N
(3) 使用何种形式的域名后缀对百度网页搜索没有影响,但域名后缀也需要考虑方便用
% c% R K0 H$ W) Q$ G7 n& }; M户记忆。.com、.cn、.net 等常见的域名后缀用户更容易记忆,一些不常见的后缀可 9 o! a0 @) d% B/ }+ V
能会让用户产生不信任感,增加用户的判断成本。 7 V0 z" @ g( x8 r
1.2 服务器、空间租用
W6 }, m' l* ~' z# W0 f' w* _服务器、空间的速度和稳定性直接影响网站的用户体验,也会影响搜索引擎的抓取。建 ' Z5 q, @/ c$ b2 N9 X0 A
议选择服务稳定、速度快的服务器或者空间。 * q1 t# V7 S$ v( t
(1) 选择有实力的正规空间商 & F9 ^: L; f* H' {3 v3 m' A* y+ O
服务器和空间的稳定性需要一定的技术实力来保障,一些没有实力的空间商,可能无力
1 [# f4 u! Y% A1 F# x( |8 Q提供良好的服务,服务的稳定性无法保证。甚至有空间商为了节省资源,故意屏蔽掉
" |5 F$ u; F, I0 S% KBaiduspider 的抓取,导致网站无法被百度网页搜索收录。
9 b# Y' v, R- C( \6 m m(2) 保证用户的访问速度和稳定性
# n+ T+ I. S4 Y(3) 根据网站规模和要提供的服务来决定选择购买何种空间(服务器) $ Z2 }+ [3 k! b3 S8 A
通常空间都会有流量、连接数以及功能上的限制,因为是多个网站共用一台服务器,稳 ; g2 i6 H* S& x! @9 T
定性会受到影响,但价格便宜;服务器各种限制较少,可以更自主的管理,但价格较贵。可
' D4 l2 \5 H4 m7 ]; I9 t以根据自己的需求来进行合理的选择。 : K1 b5 B8 S. h: B- Y# x$ r |
(4) 根据用户群分布选择接入商 7 [4 a8 D0 z7 x) t6 i9 v
由于互通问题的存在,选择接入商也很重要,如果用户群主要在联通,就尽量选择联通
0 z. U5 _7 C& Y; T访问较好的接入商,如果用户群主要在电信,则选择电信访问较好的接入商。如果用户群在 . H, G% I* }& ?
全国,那就选择一家互通处理的比较好的接入商。 & R }1 m6 P- M
6 百度搜索引擎优化指南
, `& ^0 j6 N5 F5 I; v$ Y$ ~5 g购买之前,可以先找一两个空间商现有的客户网站,测试访问情况如何。
* u; S* z- d( ]2 面向搜索引擎的网站建设
: |" p; u! z' f搜索引擎只是网站上一个普通的访客,对网站的抓取方式、对网站/网页的价值判断, ) H! a; w& M1 d) t& B. Q# B/ ?- f
也都是从用户的角度出发的,任何对用户体验的改进,都是对搜索引擎改进。对搜索引擎的 9 J1 F _% `7 v+ m7 R5 A: t' \
优化,同时也会让用户受益。
) Y4 L" ~( I) O% e, p5 S面向搜索引擎的网站建设,主要分为三个部分:如何更好的让搜索引擎收录网站中的内 5 p) m8 v4 `! V' t6 N8 {5 B) i
容、如何在搜索引擎中获得良好的排名、如何让用户从众多的搜索结果中点击你的网站。简
9 _5 b6 V3 [2 j+ K9 n8 O3 E8 i# ?单来说,就是收录、排序、展现。下面我们将从这三个方面分别介绍。 " j, t9 E) x1 I6 {/ [
2.1 良好收录
) l9 {9 T! Z" F6 n2.1.1 机器可读
& o% L1 e; Y" o% v" K4 z百度通过一个叫做Baiduspider 的程序抓取互联网上的网页,经过处理后建入索引中。 6 g0 ~$ P0 U4 O4 ^" w5 j
目前Baiduspider 只能读懂文本内容,flash、图片等非文本内容暂时不能处理,放置在flash、
' J" S e! y; d1 h图片中的文字,百度无法识别。
1 i0 ^% z/ s" i; G建议使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接,搜索引擎 9 F( U2 I7 F8 r
暂时无法识别Flash、图片、Javascript 中的内容,这部分内容无法搜索到;仅在flash、 , ~8 a* Z7 l1 d- t) |
Javascript 中包含链接指向的网页,百度可能无法收录。 7 Q! {9 E5 O' q9 c
冘 使用文字而不是flash、图片、Javascript 等来显示重要的内容或链接 ' W. p+ b8 E( {5 U. W: Z
冘 如果必须使用Flash 制作网页,建议同时制作一个供搜索引擎收录的文字版,并在首页 9 a1 v3 E% S w) k6 n
使用文本链接指向文字版
) B# q/ Y( Z- l冘 Ajax 等搜索引擎不能识别的技术,只用在需要用户交互的地方,不把希望搜索引擎“看”
7 e- q' D' m6 ~' a( x到的导航及正文内容放到Ajax 中 / w7 A0 a7 W/ H5 C* t+ x
冘 不使用frame 和iframe 框架结构,通过iframe 显示的内容可能会被百度丢弃
% \0 D, ?! k( z- v: N \& h4 ^8 l v我们建议:
1 M: U* M$ W- p% q3 {! l# D! ]0 s7 A' Q7 百度搜索引擎优化指南 ' e ~: G/ k! I: v, A2 |/ D6 ]
上面例子中,虽然网页上提供了很丰富的信息,但由于信息都在falsh 中,搜索引擎无法提取,对
! U* a2 s, m$ k: A6 w搜索引擎来讲,这个网页没有任何内容。 * K" R; ^6 k* ~
2.1.2 网站结构 3 k. l! g6 X" e2 u
网站应该有清晰的结构和明晰的导航,这能帮助用户快速从你的网站中找到自己需要的 - n' a4 X# u7 K h' e2 v
内容,也可以帮助搜索引擎快速理解网站中每一个网页所处的结构层次。
* |9 Y" i; X$ F' E2 i网站结构建议采用树型结构,树型结构通常分为以下三个层次:首页——频道——文章 . _+ e, I i9 d! I+ X) O
页。象一棵大树一样,首先有一个树干(首页),然后再是树枝(频道),最后是树叶(普通
7 M5 c( p# ^( {7 f内容页)。树型结构的扩展性更强,网站内容变多时,可以通过细分树枝(频道)来轻松应
. q5 O, L; v; R" [: C2 b( L. |: w对。
5 X X7 i- O' R6 K% q3 G5 H理想的网站结构应该是更扁平一些,从首页到内容页的层次尽量少,这样搜索引擎处理
& `0 y$ k9 L# F% R% j5 q% P起来,会更简单。
6 c4 f% X" G0 X* k* @3 L同时,网站也应该是一个网状结构,网站上每个网页都应该有指向上、下级网页以及相
/ z9 T0 _2 h. M9 Y3 F* o, x关内容的链接:首页有到频道页的链接,频道页有到首页和普通内容页的链接、普通内容页
2 }1 O- d; y+ T' ^& H& [有到上级频道以及首页的链接、内容相关的网页间互相有链接。
, Q |' s6 T' q z' j; T$ A网站中每一个网页,都应该是网站结构的一部分,都应该能通过其他网页链接到。
5 o" X3 b) I. ?总结一下,合理的网站结构应该是一个扁平的树型网状结构.........。 / O8 z9 l% z4 n/ w
冘 确保每个页面都可以通过至少一个文本链接到达。 : Q- R: h9 Z) c/ c3 ?3 G
冘 重要的内容,应该能从首页或者网站结构中比较浅的层次访问到。 8 m: t* S _/ J( d$ a# G' s3 G# D
我们建议: - Q9 D/ T, H V" `
8 百度搜索引擎优化指南
% o* l' o9 S5 [* W冘 合理分类网站上的内容,不要过度细分。 ! ?+ |+ ~% @5 A/ x; ^0 L7 w+ A3 w
网站应该有简明、清晰的导航,可以让用户快速找到自己需要的内容,同时也可以帮助 , {3 S7 o# ^7 |7 V. q" ]6 Y
搜索引擎更好的了解网站的结构。 0 n) q S7 [0 {$ ?0 r
冘 为每个页面都加上导航栏,让用户可以方便的返回频道、网站首页,也可以让搜索引擎
7 L$ ]4 d6 G' Q; ?; _$ F& w方便的定位网页在网结构中的层次。 8 Y9 ?4 O- J5 ?! ]# [0 N0 n; \" A4 D
冘 内容较多的网站,建议使用面包屑式的导航,这更容易让用户理解当前所处的位置:网
2 E: h* d. r: n4 b# u' g2 N站首页> 频道> 当前浏览页面
3 u, S8 H3 @6 y1 P通过面包屑导航,用户可以很清楚的知道自己所在页面在整个网站中的位置,可以方便的返回上 ) S/ C) D: Y) m2 V: n
一级频道或者首页也很方便。
& R; ]6 G Z6 b) D冘 导航中使用文字链接,不使用复杂的js 或者flash $ u& P& F+ ~& W, ]$ y; R
冘 使用图片做导航时,可以使用Alt 注释,用Alt 告诉搜索引擎所指向的网页内容是什么 : u& S% M/ H" a8 M
2.1.3 子域名与目录的选择 ' e, Q& Z$ p2 h3 u B7 N- v
选择使用子域名还是目录来合理的分配网站内容,对网站在搜索引擎中的表现会有较大 3 b5 U5 z1 x3 k3 R! J8 d1 o- ]
的影响。
/ ?: |# {* U2 }; G0 M+ u" ^冘 在某个频道的内容没有丰富到可以当做一个独立站点存在之前,使用目录形式;等频
" O" E/ B0 o% O; g$ v2 Z/ K3 Z道下积累了足够的内容,再转换成子域名的形式 ' d8 a8 u1 e+ v0 i
一个网页能否排到搜索结果的前面,“出身”很重要,如果出自一个站点权重较高的
" `, X3 P9 l( W9 ^& ~网站,那排到前面的可能性就越大,反之则越小。通常情况下主站点的权重是最高的, 4 C$ H/ y. Y G0 K* @2 ^/ G
子站点会从主站点继承一部分权重,继承的多少,视子站点质量而定。 - L! d( A6 v+ `- c' O% x9 W8 \
在内容没有丰富到可以做为一个独立站点之前,内容放到主站点下一个目录中能在
: S0 U5 t# \; ?- }% K搜索引擎中获得更好的表现。 % h" f( s- b9 }) M G
冘 内容差异度较大、关联度不高的内容,使用子站点形式 $ L8 n% I5 N n) @
搜索引擎会识别站点的主题,如果站点中内容关联度不高,可能导致搜索引擎错误 3 m: t$ f( Q( x, F$ v
的识别。关联度不高的内容,放在不同的子域名下,可以帮助搜索引擎更好的理解站点
) } c ~; Y- q$ P5 w( ]的主题。
: ^# ?. e- |1 ^% G; Q冘 域名间内容做好权限,互相分开,a. example.com 下的内容,不能通过b.
9 c1 h" G, Z9 l ^: A8 Oexample.com 访问 5 d" e9 ]. A) N9 P; e% k
子域名间的内容可以互相访问,可能会被搜索引擎当做重复内容而进行除重处理, ) c) C9 |' B, v o) C
我们建议:
% @0 g* {5 x0 P我们建议: ( _$ Q! r. z$ B! a9 J, u
9 百度搜索引擎优化指南
0 f: t/ ~9 k/ a& z保留的url 不一定是正常域名下的。
# x) c/ i3 L5 s冘 不要滥用子域名
w! k# y4 c; \- G+ a% T无丰富内容而滥用大量子域名,会被搜索引擎当做作弊行为而受到惩罚。
|