" Y+ g3 o3 l/ C8 V9 s/ T4 ^- S4 A+ ](不久前,和@范卫锋 聊天,谈到我们作为技术的外行,怎么去了解一些基本的互联网知识,于是计划将一个外行人对技术的理解,写下来。某些概念和原理的解释可能不太准确,另外和投资没有直接关系,供其他转行、跨行同学参考。)
7 E; M! X' V/ g4 q8 D L
4 C+ b4 r0 Y& D3 ]) `9 S: f, n5 c第一篇:带宽常识 我家是10兆的宽带,上网为什么巨慢?# \0 b2 |5 O+ ^
( E& \8 B5 e; _2 {1 \: ^, L! P; X- E0 u
如果问题是“我们小区里面是双向10车道,为什么上班路上还是堵车呢?”答案很明显,小区不堵车,但我们的上班地点,出了小区,还得老远的跑到中心区CBD去。你家里的10兆宽带(如果有的话),只是从你家到网络接入商的带宽,不等于到所有地方都是这个速度。
6 }& X5 y& G5 D
2 T) {, Z$ | e# j+ Z0 Z
/ `6 |, \* e6 m) z D6 d! T* u: ~/ C9 `
/ I; d0 a1 w- D8 U* k上网快慢,涉及到几个问题:你的电脑;你的网络接入商;你希望使用的互联网服务(简单理解为要访问的目标网站吧);目标网站的系统;目标网站所在网络环境。
, Q/ D: Z" X! w9 R5 l* x
x6 x. j; S4 `. u6 [9 F f6 P2 p4 z" h' N8 c1 q5 k
1,跑车还是拖拉机?
( B, ], c8 N$ R$ O6 d( v1 ^" g) v* F, G
4 B* }2 `2 B3 o6 `; c6 r
影响网速的因素,首先要看,你的电脑配置是不是太落后,是不是中了木马、流氓软件等。是不是同时使用了太多耗费带宽的服务,比如看视频,下载大文件等。
4 s5 j5 j8 H d% E8 L' | ]# n! U% L/ j
$ n9 M2 j! P) J9 E4 W7 U
0 V5 A. s+ g" _5 e! L& G) I
2,网络接入商
P2 u+ I$ r! o
' `- D- {4 v6 o7 s% j2 b4 r% ^, L2 e- @' c% _& ?, ~4 W
简单来说,就是能牵线到你家里,然后让你的电脑上网的那个公司(现在也有无线的方式)。由于历史的原因,以前只有中国电信能为普通用户提供这种服务,所以现在最大的接入商,仍然是中国电信和中国网通。其他大大小小的各种接入商(比如长城宽带、E家宽、歌华有线等),可以看作是前两者的分包商。这些可以统称ISP (Internet Service Provider),互联网服务提供商。
* S3 r* H9 W+ @ ?" A! P
0 X5 c5 c& K3 o* Y! G
! g! J$ s$ L1 y# _0 _* h3,目标网站
" k1 V/ n0 S. v2 P- H& o/ G+ N6 J7 ]- E' w
, `1 }* n8 g1 Y6 N- h5 ?作为上班一族的你,中心区是你经常去的目的地;而上网的话,目标网站的服务器在哪里?同样由于历史原因,绝大多数都在中国电信或者中国网通的机房里,也有部分公司,通过从电信、网通租赁一些带宽,自建了机房,再向外提供服务。这些都叫IDC(Internet Data Center),即互联网数据中心。
+ Z9 f0 {- E1 O- K2 d- {! v3 U
5 s. K) B, i0 v5 d. d" M& P5 Q$ Q$ R3 F3 ^% ?! Z
4,目的地是小区还是中心区?
7 B: R& N0 U/ _" v y
i6 l- K# J# d; I' w( w2 D
. `7 A2 S% v" \) {3 j: x, H2 I假设你的接入商是长城宽带(简称长宽),10兆(M)入户。或者,从你家到长宽的骨干网,的确有10兆(也就是小区内的10车道)。问题是,你经常访问的是新浪、网易以及雪球等网站,而这些网站的服务器不在长宽。于是,如果长宽的用户越来越多,而长宽与电信、网通之间的接口带宽没有相应增加的话,网速就越来越慢。所以,即使是相同的带宽标准,不同的接入商,与你实际使用到的带宽差别非常大。这里不得不为电信、网通做一下广告,他们的ADSL以及专线等方式要比其他接入商靠谱。. E) T+ e. }& e& G A
% s d) {2 t h- X2 @7 L9 u0 N; Q1 L9 A) R9 ?! |
5,上班高峰期2 k) m* U% X; m
8 B9 b' K1 B2 a! C H
% j" Q0 m8 J K- G) M
虽然,网络接入商,不断的增加自己与电信、网通等骨干网之间的带宽(要钱的),也就是将小区出去的路修得宽一点。但是仍然难解决上班高峰期,大家一起上路的问题。所以,很多你会发现,早上起来觉得网速很快,但到晚上就不灵了。因为对小区宽带用户来说,晚上是使用高峰期。3 G# X* K) c; m w/ W8 K
, f, k3 {: k# l. Q
3 t) [& p/ x$ }2 B6,小车还是火车?
) Y& G3 Q# T; R
9 f6 Y- N# x7 f$ `3 b" b T1 y( \$ {
如果你的小区有1000辆车需要开到中心区,为了不堵车,是不是得修一条1000车道宽的公路呢?当然不是,因为1000辆车不是并排一起走的,每辆车只占几米长的一小截路面,所以10车道的公路就足够了。8 F0 R6 P3 \# \ A8 J
8 ?; `2 b4 C' q F/ {
' ] ?+ C+ w& G( F9 ?# V+ _% v但,如果这些车不是轿车,而是火车(每列车所占的路面很长),恐怕就得要几百条车道,才不会堵车了。
! X1 ~/ A. C: ^( b3 H$ C% R1 ^& r: d0 h; d+ l0 P
" U: }) ~, V# k2 t' p0 x' S
同理,假设小区里有1000户人家开设了10兆接入,接入商并非提供10兆X1000的总出口带宽。因为,多数人的上网行为,比如浏览网页,仅在打开页面极短的时间内产生高流量,而且也不是所有用户约好了一起刷页面,可以实现错峰。如果是QQ聊天之类的活动,所占的带宽也非常小。也就是说,你的10兆带宽,多数时间是闲置的。8 C Z, F( k! [& R; w$ R% o7 L3 T
3 d2 v1 q6 s6 A3 x% L2 b
$ Y( A3 h5 b1 m- [: @
因此,网络接入商不会按理论最大值来配备带宽。如果平时大家都是开小车(浏览网页、聊天)还好,如果开火车,就容易堵了。进行大文件的下载(包括在线看视频)就像开火车,特别是使用P2P的下载软件(比如迅雷、电驴),因为带宽长时间被占据,如果接入商的总带宽冗余不多,少量的火车就会将出口挤爆。3 X% t! L) W5 R; B0 I* w- `5 U- ^/ E3 ^
8 Y6 c; }' ]8 e6 q6 ^9 o
5 {( g6 w+ R0 g4 b( S! J0 E* m/ Q6 A# K+ O
7,目标网站的系统7 W* j+ S, D( Q/ G5 ?% Y5 U
% v9 S. f6 E! K) F0 k* W# z, N1 F
( k" J2 H" b% [9 W1 L
你一路飞车到了中心区,但是里面塞满了车,你只能在路口排队等。用户所能感受的网速,与目标网站所提供的服务及其质量关系极大,主要是受网站的架构、数据库读写、缓存技术、以及前端页面的编码、以及访问压力等影响。一般来说,静态页面抗压能力要比动态页面强很多,换个意思是,同样的条件下,静态页面通常比动态页面快。静态页面(或者是应该静态化的页面)可以简单理解为,所有人看到的几乎都是一样的内容,比如新闻页面;动态页面每个人看到的都是各不相同,比如微博自己的首页,或者对更新频率要求在秒以内的页面。# p2 D) s! e8 y/ b9 u: E9 m
) v1 K# c# k3 }" r/ t+ p" b# }5 Z; _! a) ^$ l8 |
3 k0 S$ i2 X/ |3 e4 d
8,目标网站的网络环境: _1 E T6 }8 H' b
2 I/ W/ X* K4 g% ? f$ n7 j+ a5 V/ X H* ^' n+ a
由于各种原因,中国主要的基础网络提供商电信和联通(前网通)之间,互联互通还存在很大障碍,另外还有教育网、金桥网、中国移动等各种网络环境。如果一台服务器,放在网通的机房,电信的用户跨网访问可能较慢,反之亦然。所以,不少网站将服务器放到双线、甚至BGP机房,以解决用户跨网访问的问题。: S Z) C1 N$ k& L
2 f4 L3 q( [$ [! D5 h. V' x" L$ B
另外,由于中国到境外的出口总带宽瓶颈以及其他原因,国内用户使用境外的互联网服务,速度明显受到影响,哪怕目标服务器是在香港。
$ Y3 O8 s. r3 C8 D' o7 v; x6 b( I5 |& o; J- z# W8 m& }
9,网络分发和加速服务5 S; S% b) I8 i$ F6 y _4 d* `
M6 \% f" V- |( u
8 v# U! V0 V' N9 b" ?
6 E2 A3 S4 P. J* c/ k# |这个不是针对单个上网用户的服务,是网络内容服务商(简称网站运营方吧),通过网络分发和加速服务,部分地解决用户的访问瓶颈问题。也就是CDN(Content Delivery Network)。
" z3 C9 S- a% |: z0 ~& B, |5 t) ]! W8 r4 K
再看之前的例子,假设目标网站的服务器,是放在北京联通下某个机房,一个海南的电信接入的用户去请求,路途遥远。虽然在光速传输上,从北京到海南的物理距离所耗费的时间几乎可以忽略。但是事实上,由于各个接入商、各地网络环境、跨城市骨干网总带宽、以及互联互不通等问题,确实存在瓶颈。4 ^- O1 r% r) a& G/ k0 ?6 M
P3 t1 N. ?- e, _! B
- e0 e: ?! a R" X V
于是有的公司(蓝汛、网宿科技、世纪互联等),在全国各地租用(或者自建)当地的机房和网络,架设了自己的全国分发系统。目标网站最终的服务器可能还是在北京,但是将内容通过他们的CDN网络向全国(全世界)分发,于是,海南的用户,直接请求当地最近的服务器的镜像数据,比以前要快很多。而别的同样在海南的其他用户,需要相同的内容时,也直接从本地最近机房读取。CDN的方式,既提供了访问速度,也节约了带宽成本。有的带宽虚耗大户,干脆组建自己的CDN网络。世界上最大的CDN服务提供商是Akamai(NASDAQ:AKAM)。. \" _% Z4 Q( q0 t! `2 }, I" a
/ K4 r0 k. Z/ h! k
5 R G' G; g( x4 B4 t& R这方式可以理解为,全国人民本来要去北京朝圣,一睹老人家遗容。按传统的方式,即使将飞机、轮船、火车、手推车等所有交通工具用上,再将北京整个城市腾空来接待,10几亿人民不知道排队到何年何月。现在有个CDN公司,将尸体一摸一样地复制了几万份,分发到全国各地,甚至某些乡镇都有。于是,人民无需背井离乡、长途跋涉远赴京城,奔丧之需又丝毫不受影响。
( R" l0 d8 q/ R* e5 N
% w: y' T$ e+ ]: r( b5 |0 h$ b2 g* p
10,动态CDN
) `/ g- C& ^1 [. g2 a5 d% P6 B! W/ Q, F2 X6 w8 i$ J3 C
1 G# l4 |$ b1 B
前面说的CDN目前主要使用在更新频率很低(甚至几乎不作更新)的静态(静态化)内容上。比如,上面的遗体,复制几万次而不影响大家哀悼,是因为复制品和原品一摸一样(至少人民感知不到区别)。如果是个活人,身体、穿着、神态等天天在变,要保证复制品质量的话,就得不停的更新,那样会导致很多运输在途的复制品变成废品。现在的动态CDN技术,能将复制频率以及向全国分发的时间,缩短到用户无法感知的程度,已经有部分公司尝试使用(价格昂贵)。% {7 L/ [1 \" c. ~% b: c( q. a
# \) z& n1 ?3 H8 B
, E' j. _7 E$ F: Q, K& Y1 N5 V
11,带宽的单位
: P+ N8 e, x2 t7 }$ ?# o. J2 h0 N! C
# g* v6 M8 ^' P% X& E
假设上面说的问题都解决了,家里10兆(10M)的带宽,下载东西时,你会发现,怎么最多也只是1.25M/秒?那是因为,服务商说的带宽(字节)单位,是bit,而我们电脑上,使用的单位是byte。1byte=8bit,需要将他们的说的数字,除以8。电脑里显示某个文件的大小时候,使用的也是byte。(雪球 梁剑)
$ G6 F/ j9 y( p+ y4 A) }% U* g( D2 `6 p4 _
. E/ t# B) ]# J9 f- M) `
2011-12-29 18:02 来自雪球 " L% K9 |# ^4 h
|