% x2 X) `$ Z' D; q
(不久前,和@范卫锋 聊天,谈到我们作为技术的外行,怎么去了解一些基本的互联网知识,于是计划将一个外行人对技术的理解,写下来。某些概念和原理的解释可能不太准确,另外和投资没有直接关系,供其他转行、跨行同学参考。)
9 v2 L" D5 x/ @. Q7 {; m; o8 J0 H
3 A) s: d, M: S* D# K& m第一篇:带宽常识 我家是10兆的宽带,上网为什么巨慢?
& x8 Q; v, O# A# V+ Q! S' {3 `
/ V; f# ~ o) O& w4 X
d! D; D. T: S8 @# T4 d) Z* `' n& Z如果问题是“我们小区里面是双向10车道,为什么上班路上还是堵车呢?”答案很明显,小区不堵车,但我们的上班地点,出了小区,还得老远的跑到中心区CBD去。你家里的10兆宽带(如果有的话),只是从你家到网络接入商的带宽,不等于到所有地方都是这个速度。4 {+ P) u& q4 M! b- J( f" O! X& G& ]
$ p9 m$ c. @# _: ~) }; N3 t
" i$ A( f y1 R/ p# B- ?' Z/ ^ K8 n4 `, D( B5 g3 `
( S8 L) W5 i z) s% Z上网快慢,涉及到几个问题:你的电脑;你的网络接入商;你希望使用的互联网服务(简单理解为要访问的目标网站吧);目标网站的系统;目标网站所在网络环境。
. m& Y3 w. o8 D! ^# ^7 Z8 b# _: {0 o
; R/ ?# M8 F6 Y2 H! S1,跑车还是拖拉机?) @) d5 k( T/ G% K
+ B2 O" x& x! q* a) s& B! }) G7 e- {4 z5 Z2 j; s
影响网速的因素,首先要看,你的电脑配置是不是太落后,是不是中了木马、流氓软件等。是不是同时使用了太多耗费带宽的服务,比如看视频,下载大文件等。
) [$ ~: Y% p9 O# I, Q9 w. d# w* R( d1 |# q5 e4 I
6 n8 y2 J* _ Y9 w: L- f: u
- l/ C+ ]* |/ j- |5 U, | S6 O2 A2,网络接入商$ V! R7 Y+ i* z: o
. s, c' i( Y9 G, O& `" {
' c& w6 a/ f" M# y6 X. k$ u6 h7 }简单来说,就是能牵线到你家里,然后让你的电脑上网的那个公司(现在也有无线的方式)。由于历史的原因,以前只有中国电信能为普通用户提供这种服务,所以现在最大的接入商,仍然是中国电信和中国网通。其他大大小小的各种接入商(比如长城宽带、E家宽、歌华有线等),可以看作是前两者的分包商。这些可以统称ISP (Internet Service Provider),互联网服务提供商。
- b6 o9 D% G2 x9 m- V9 V1 }) S- Q# q @. [
& g1 \$ C8 S! G0 s& H3,目标网站- W' ]" y" m" W; P
8 u# ^" i2 ], N1 Y% b& d
6 \4 c5 A v9 B( M& ~
作为上班一族的你,中心区是你经常去的目的地;而上网的话,目标网站的服务器在哪里?同样由于历史原因,绝大多数都在中国电信或者中国网通的机房里,也有部分公司,通过从电信、网通租赁一些带宽,自建了机房,再向外提供服务。这些都叫IDC(Internet Data Center),即互联网数据中心。
) j& f* x8 Q" J% z3 O
( _, u. f1 t5 k! y3 P+ e/ \; n, U3 _: i. i a3 N: h* i
4,目的地是小区还是中心区?5 B, Z7 i2 R3 H. O4 p( y
# r( s/ `$ m5 E- D
- e" x+ Z {8 i- D' \: m假设你的接入商是长城宽带(简称长宽),10兆(M)入户。或者,从你家到长宽的骨干网,的确有10兆(也就是小区内的10车道)。问题是,你经常访问的是新浪、网易以及雪球等网站,而这些网站的服务器不在长宽。于是,如果长宽的用户越来越多,而长宽与电信、网通之间的接口带宽没有相应增加的话,网速就越来越慢。所以,即使是相同的带宽标准,不同的接入商,与你实际使用到的带宽差别非常大。这里不得不为电信、网通做一下广告,他们的ADSL以及专线等方式要比其他接入商靠谱。0 h2 n |- S* M# K2 f
7 a1 |7 H5 M& z; S/ J' e4 ]( @
H5 L. o" t& K& _( B5,上班高峰期) d2 Z7 k- A0 }0 [% t( Y3 t
. _' _# q$ D4 \7 M
: {) X1 A% x% f5 R$ e; n虽然,网络接入商,不断的增加自己与电信、网通等骨干网之间的带宽(要钱的),也就是将小区出去的路修得宽一点。但是仍然难解决上班高峰期,大家一起上路的问题。所以,很多你会发现,早上起来觉得网速很快,但到晚上就不灵了。因为对小区宽带用户来说,晚上是使用高峰期。
: j2 X! E! K- \# b# w$ B# l9 }5 b3 V+ s9 m/ E- \8 v/ i
) e( p0 ~4 X& ~" }$ r k3 n3 v# C
6,小车还是火车?
. {, b' ~ }* p; K: F) g8 I$ E' p) \+ w! ^! ^
' X# m5 B5 [- E0 U5 A0 t如果你的小区有1000辆车需要开到中心区,为了不堵车,是不是得修一条1000车道宽的公路呢?当然不是,因为1000辆车不是并排一起走的,每辆车只占几米长的一小截路面,所以10车道的公路就足够了。9 T+ V( @5 Q1 z8 _5 L i) e
5 B$ ? D" ^, y: u) P
4 y$ M6 Z; n; `, f+ o# U但,如果这些车不是轿车,而是火车(每列车所占的路面很长),恐怕就得要几百条车道,才不会堵车了。
( Z# R: q( K+ T c8 r7 k, [( Q: Q7 e1 Z. F) Q* u4 |2 T3 v; J
* ~$ L; m2 i5 k o6 ^
同理,假设小区里有1000户人家开设了10兆接入,接入商并非提供10兆X1000的总出口带宽。因为,多数人的上网行为,比如浏览网页,仅在打开页面极短的时间内产生高流量,而且也不是所有用户约好了一起刷页面,可以实现错峰。如果是QQ聊天之类的活动,所占的带宽也非常小。也就是说,你的10兆带宽,多数时间是闲置的。
( E$ b: q; R) ^- S- h0 P+ s4 H l, i% }% c8 K) j, ~
7 o( c% S0 ? A0 f6 s5 A因此,网络接入商不会按理论最大值来配备带宽。如果平时大家都是开小车(浏览网页、聊天)还好,如果开火车,就容易堵了。进行大文件的下载(包括在线看视频)就像开火车,特别是使用P2P的下载软件(比如迅雷、电驴),因为带宽长时间被占据,如果接入商的总带宽冗余不多,少量的火车就会将出口挤爆。
# c) t. ` V# V, B' P2 k; a6 b. B
3 z& Y) P: Y, J7 `
1 k( Y1 q7 u: U, v; Z/ Y: U
- T& j3 c, W, ^8 F7,目标网站的系统
" ~, N' u, Q" [
: \" B) `8 Z: z) s7 d
* c3 y* X K8 y5 M你一路飞车到了中心区,但是里面塞满了车,你只能在路口排队等。用户所能感受的网速,与目标网站所提供的服务及其质量关系极大,主要是受网站的架构、数据库读写、缓存技术、以及前端页面的编码、以及访问压力等影响。一般来说,静态页面抗压能力要比动态页面强很多,换个意思是,同样的条件下,静态页面通常比动态页面快。静态页面(或者是应该静态化的页面)可以简单理解为,所有人看到的几乎都是一样的内容,比如新闻页面;动态页面每个人看到的都是各不相同,比如微博自己的首页,或者对更新频率要求在秒以内的页面。
3 T/ L6 y8 p) s- v0 F+ @1 c0 e" P$ c. }* N
7 d, O$ [, G: H- E
3 k1 T. @2 _# ?; g0 W
8,目标网站的网络环境+ }2 H/ Q+ R9 D+ r" u5 e
: k! _8 K9 a: s" W! v2 G8 b3 m! [$ {6 i; g" a
由于各种原因,中国主要的基础网络提供商电信和联通(前网通)之间,互联互通还存在很大障碍,另外还有教育网、金桥网、中国移动等各种网络环境。如果一台服务器,放在网通的机房,电信的用户跨网访问可能较慢,反之亦然。所以,不少网站将服务器放到双线、甚至BGP机房,以解决用户跨网访问的问题。5 k: f6 ?; p+ G. @! F+ [0 [
|; z5 V" J2 M: J6 V另外,由于中国到境外的出口总带宽瓶颈以及其他原因,国内用户使用境外的互联网服务,速度明显受到影响,哪怕目标服务器是在香港。. v5 G( S, u, U7 s& f7 ~0 m" f
) u; W* J4 U# v* e9,网络分发和加速服务( y- w$ u* j$ x5 J0 X
5 Q1 @$ k; f8 R0 @2 o2 v% U6 _
( k- P6 Y" Y$ d$ A4 [, Q
) E5 h# a. n; O6 m8 H这个不是针对单个上网用户的服务,是网络内容服务商(简称网站运营方吧),通过网络分发和加速服务,部分地解决用户的访问瓶颈问题。也就是CDN(Content Delivery Network)。
$ A( Q$ ?9 e$ X' u& ]: p) q
) |- y0 O- ~ W0 R5 t8 u% \再看之前的例子,假设目标网站的服务器,是放在北京联通下某个机房,一个海南的电信接入的用户去请求,路途遥远。虽然在光速传输上,从北京到海南的物理距离所耗费的时间几乎可以忽略。但是事实上,由于各个接入商、各地网络环境、跨城市骨干网总带宽、以及互联互不通等问题,确实存在瓶颈。7 ?6 h* J, e0 W1 G
/ q2 K4 Q6 m: u! \/ y, O. X
9 l. G" I6 z0 x$ B- n于是有的公司(蓝汛、网宿科技、世纪互联等),在全国各地租用(或者自建)当地的机房和网络,架设了自己的全国分发系统。目标网站最终的服务器可能还是在北京,但是将内容通过他们的CDN网络向全国(全世界)分发,于是,海南的用户,直接请求当地最近的服务器的镜像数据,比以前要快很多。而别的同样在海南的其他用户,需要相同的内容时,也直接从本地最近机房读取。CDN的方式,既提供了访问速度,也节约了带宽成本。有的带宽虚耗大户,干脆组建自己的CDN网络。世界上最大的CDN服务提供商是Akamai(NASDAQ:AKAM)。
' S6 v" C9 h2 B) x2 Q" ^( O; M* W( q! J7 q
7 C4 H3 D* b& M/ _' G2 C这方式可以理解为,全国人民本来要去北京朝圣,一睹老人家遗容。按传统的方式,即使将飞机、轮船、火车、手推车等所有交通工具用上,再将北京整个城市腾空来接待,10几亿人民不知道排队到何年何月。现在有个CDN公司,将尸体一摸一样地复制了几万份,分发到全国各地,甚至某些乡镇都有。于是,人民无需背井离乡、长途跋涉远赴京城,奔丧之需又丝毫不受影响。# A2 u/ I3 I9 q5 i
0 f. U! j3 S2 l
* Q: s: m% k S5 H( D4 ?10,动态CDN
/ n- `7 K* D9 W8 q9 x3 H5 Y" q F) Y6 D$ K( e7 A
+ V8 Q9 D& G' P& `4 R' L$ J前面说的CDN目前主要使用在更新频率很低(甚至几乎不作更新)的静态(静态化)内容上。比如,上面的遗体,复制几万次而不影响大家哀悼,是因为复制品和原品一摸一样(至少人民感知不到区别)。如果是个活人,身体、穿着、神态等天天在变,要保证复制品质量的话,就得不停的更新,那样会导致很多运输在途的复制品变成废品。现在的动态CDN技术,能将复制频率以及向全国分发的时间,缩短到用户无法感知的程度,已经有部分公司尝试使用(价格昂贵)。
" g* L& j* e. J3 ^
) j& Y. n* [! ]
3 r! q5 l! Z( Y+ t11,带宽的单位
% W$ y% x& l* y0 J! q9 X5 [
M9 `- p: v$ g2 E) \( {+ Q- ?
; D/ P3 p" j. J2 S6 L3 i- Q. v假设上面说的问题都解决了,家里10兆(10M)的带宽,下载东西时,你会发现,怎么最多也只是1.25M/秒?那是因为,服务商说的带宽(字节)单位,是bit,而我们电脑上,使用的单位是byte。1byte=8bit,需要将他们的说的数字,除以8。电脑里显示某个文件的大小时候,使用的也是byte。(雪球 梁剑)
5 V9 J Z; [: B; q1 e4 e3 h! U0 _: E& M K
1 _5 z* n! ]7 o7 e, P( X' p. @. i2011-12-29 18:02 来自雪球
" P5 p- S7 z2 o, D6 n( I* T. i# V: m$ q |