5 R( A$ _8 ~4 I( t
(不久前,和@范卫锋 聊天,谈到我们作为技术的外行,怎么去了解一些基本的互联网知识,于是计划将一个外行人对技术的理解,写下来。某些概念和原理的解释可能不太准确,另外和投资没有直接关系,供其他转行、跨行同学参考。)
8 A: Q+ |: Q- p" k) r! ]
, E, x% T8 z2 g8 t8 [9 F4 {$ y第一篇:带宽常识 我家是10兆的宽带,上网为什么巨慢?+ g6 q. V$ j; p& Y6 H- x$ V7 s
/ r- _1 \' C- p. O$ `6 b! L6 ~
, ]+ T7 u9 | v9 q/ b* W7 F
如果问题是“我们小区里面是双向10车道,为什么上班路上还是堵车呢?”答案很明显,小区不堵车,但我们的上班地点,出了小区,还得老远的跑到中心区CBD去。你家里的10兆宽带(如果有的话),只是从你家到网络接入商的带宽,不等于到所有地方都是这个速度。
' g! e1 F* L% Z9 [' p* D
2 j7 A* V4 S8 A; Y k3 R1 @. i- Q+ h; G, I" {$ V- e4 o9 i
z8 B, D) ~( o
4 ?0 X' R& U2 h! l* F$ v; j上网快慢,涉及到几个问题:你的电脑;你的网络接入商;你希望使用的互联网服务(简单理解为要访问的目标网站吧);目标网站的系统;目标网站所在网络环境。 5 u: A8 z1 r. P! h: _/ ?" a* b
) }/ A* T+ k# W. v! `% Q7 N' P9 j B$ C; |
1,跑车还是拖拉机?
% S, f9 \; S. i( l a+ i3 ~# p1 d: _" U: C: j. S! F
4 [5 q# k$ K1 [0 \5 X& J
影响网速的因素,首先要看,你的电脑配置是不是太落后,是不是中了木马、流氓软件等。是不是同时使用了太多耗费带宽的服务,比如看视频,下载大文件等。- t+ {/ F* s2 F+ T/ s& i
5 O* i% A, `. f' Z4 f0 ` r: Q/ ~: i
% Y, q" d& a# H& O9 C& B
2,网络接入商1 F, k( y" _' | D% W! N o" O
d. C4 @% i. c# V6 g1 d
h( N# q `8 p: C简单来说,就是能牵线到你家里,然后让你的电脑上网的那个公司(现在也有无线的方式)。由于历史的原因,以前只有中国电信能为普通用户提供这种服务,所以现在最大的接入商,仍然是中国电信和中国网通。其他大大小小的各种接入商(比如长城宽带、E家宽、歌华有线等),可以看作是前两者的分包商。这些可以统称ISP (Internet Service Provider),互联网服务提供商。. y6 n. O* X2 p; n/ N' K
/ Y. S7 O* r- {$ x9 I
) V8 z9 }% ^& ^- a$ L- R3,目标网站/ D9 |9 s: T- Y
- b2 J( B8 o3 i0 _$ r$ @& @' l; w8 ?$ k% {
作为上班一族的你,中心区是你经常去的目的地;而上网的话,目标网站的服务器在哪里?同样由于历史原因,绝大多数都在中国电信或者中国网通的机房里,也有部分公司,通过从电信、网通租赁一些带宽,自建了机房,再向外提供服务。这些都叫IDC(Internet Data Center),即互联网数据中心。5 k0 }# ^8 R1 P6 Q8 T( J0 b
9 B! Q3 v- U3 l
+ Z; O7 n# C; R5 H& K# q% k0 F4,目的地是小区还是中心区?
& T! i+ c6 ^+ q$ Q
, O$ I9 r4 Z9 W; E" I) H$ v" i1 ]2 |: I
假设你的接入商是长城宽带(简称长宽),10兆(M)入户。或者,从你家到长宽的骨干网,的确有10兆(也就是小区内的10车道)。问题是,你经常访问的是新浪、网易以及雪球等网站,而这些网站的服务器不在长宽。于是,如果长宽的用户越来越多,而长宽与电信、网通之间的接口带宽没有相应增加的话,网速就越来越慢。所以,即使是相同的带宽标准,不同的接入商,与你实际使用到的带宽差别非常大。这里不得不为电信、网通做一下广告,他们的ADSL以及专线等方式要比其他接入商靠谱。5 w. ~* q z4 B! s5 h+ _/ G+ e
9 A( U5 k* O( @+ ?5 u
% B; r0 Q% _- |- v5,上班高峰期/ L: K. k7 y' U1 @+ Z0 G4 \
- T, G* E+ e5 [/ g. @( J; R. E7 J) C! z, q
虽然,网络接入商,不断的增加自己与电信、网通等骨干网之间的带宽(要钱的),也就是将小区出去的路修得宽一点。但是仍然难解决上班高峰期,大家一起上路的问题。所以,很多你会发现,早上起来觉得网速很快,但到晚上就不灵了。因为对小区宽带用户来说,晚上是使用高峰期。
! @) u" r# Q/ k" N- v0 N* }- l9 u* K0 D9 s
4 U8 u, M* s, s, X3 |% p
6,小车还是火车?$ ?- Y' @5 o4 M: ?
' ?& `' w& \( b! V2 t7 B
7 f- t5 v* J& ]( `% ~: e8 @7 E如果你的小区有1000辆车需要开到中心区,为了不堵车,是不是得修一条1000车道宽的公路呢?当然不是,因为1000辆车不是并排一起走的,每辆车只占几米长的一小截路面,所以10车道的公路就足够了。5 V4 ]4 B7 n+ G6 }0 {/ L
0 x% c; J4 d) B' q7 F9 g
& Y4 g: G" k3 z! j3 Y: o3 i! \
但,如果这些车不是轿车,而是火车(每列车所占的路面很长),恐怕就得要几百条车道,才不会堵车了。
1 [% [ Q- X# I, h: p
) a$ o& `% k9 O& q( X1 B" L- k( R" ^7 C7 a
同理,假设小区里有1000户人家开设了10兆接入,接入商并非提供10兆X1000的总出口带宽。因为,多数人的上网行为,比如浏览网页,仅在打开页面极短的时间内产生高流量,而且也不是所有用户约好了一起刷页面,可以实现错峰。如果是QQ聊天之类的活动,所占的带宽也非常小。也就是说,你的10兆带宽,多数时间是闲置的。
; U3 i% u4 i- r9 Q) ]) K5 \' w
8 N/ o9 A2 w: b
- W: M: g: ?0 c9 c因此,网络接入商不会按理论最大值来配备带宽。如果平时大家都是开小车(浏览网页、聊天)还好,如果开火车,就容易堵了。进行大文件的下载(包括在线看视频)就像开火车,特别是使用P2P的下载软件(比如迅雷、电驴),因为带宽长时间被占据,如果接入商的总带宽冗余不多,少量的火车就会将出口挤爆。8 N! ]) `# l& J: i
: u- t# d9 K/ m* P6 }2 M0 B- {' h6 R- |* u! r5 d% V* S, O
# }/ C; i; F$ t+ Z/ S
7,目标网站的系统
5 p) L. W$ S% j! C: E' t
- d: B. N7 M/ c, V! Y9 R# N; l, v1 m; E! U
你一路飞车到了中心区,但是里面塞满了车,你只能在路口排队等。用户所能感受的网速,与目标网站所提供的服务及其质量关系极大,主要是受网站的架构、数据库读写、缓存技术、以及前端页面的编码、以及访问压力等影响。一般来说,静态页面抗压能力要比动态页面强很多,换个意思是,同样的条件下,静态页面通常比动态页面快。静态页面(或者是应该静态化的页面)可以简单理解为,所有人看到的几乎都是一样的内容,比如新闻页面;动态页面每个人看到的都是各不相同,比如微博自己的首页,或者对更新频率要求在秒以内的页面。
" l1 S% ]. T2 z; M
# ]9 z! U+ P) u' c) f: p/ T9 }+ W$ \: R
( [1 K0 `0 Q0 F/ d$ V
8,目标网站的网络环境
3 `* b) x2 O1 O) q! Q. t4 }: M9 s- m4 p9 h* j/ U+ l5 [. Y/ R0 v+ A
% Q- y& L" {% h) [, ?
由于各种原因,中国主要的基础网络提供商电信和联通(前网通)之间,互联互通还存在很大障碍,另外还有教育网、金桥网、中国移动等各种网络环境。如果一台服务器,放在网通的机房,电信的用户跨网访问可能较慢,反之亦然。所以,不少网站将服务器放到双线、甚至BGP机房,以解决用户跨网访问的问题。
6 R3 v. q/ Y- C/ o; ]* g$ E* H% T( P* B. {
另外,由于中国到境外的出口总带宽瓶颈以及其他原因,国内用户使用境外的互联网服务,速度明显受到影响,哪怕目标服务器是在香港。
8 ~# w" h& F- |) k9 J& h0 b. Z1 V Z, [3 o
9,网络分发和加速服务
. o# `* v7 D# E' A' w% i! j# F8 v1 O! W: Q9 |% a
& _% H4 y$ P4 w/ x; M. G
) _" N! o+ P2 P$ P0 C( O这个不是针对单个上网用户的服务,是网络内容服务商(简称网站运营方吧),通过网络分发和加速服务,部分地解决用户的访问瓶颈问题。也就是CDN(Content Delivery Network)。. g: V9 j6 Z& f* M- ~
* F3 X3 `- @/ }/ B6 `" p# o再看之前的例子,假设目标网站的服务器,是放在北京联通下某个机房,一个海南的电信接入的用户去请求,路途遥远。虽然在光速传输上,从北京到海南的物理距离所耗费的时间几乎可以忽略。但是事实上,由于各个接入商、各地网络环境、跨城市骨干网总带宽、以及互联互不通等问题,确实存在瓶颈。
) ?/ ]3 B7 ~: u" r
' W1 M' y }6 v: h5 w
) ^5 g7 [: `4 b# L% ~8 p于是有的公司(蓝汛、网宿科技、世纪互联等),在全国各地租用(或者自建)当地的机房和网络,架设了自己的全国分发系统。目标网站最终的服务器可能还是在北京,但是将内容通过他们的CDN网络向全国(全世界)分发,于是,海南的用户,直接请求当地最近的服务器的镜像数据,比以前要快很多。而别的同样在海南的其他用户,需要相同的内容时,也直接从本地最近机房读取。CDN的方式,既提供了访问速度,也节约了带宽成本。有的带宽虚耗大户,干脆组建自己的CDN网络。世界上最大的CDN服务提供商是Akamai(NASDAQ:AKAM)。
1 _6 f8 E7 u. I: [3 M0 e; |: H" d5 N O* L" q: }% w
' x' U6 a+ N5 D/ W4 G这方式可以理解为,全国人民本来要去北京朝圣,一睹老人家遗容。按传统的方式,即使将飞机、轮船、火车、手推车等所有交通工具用上,再将北京整个城市腾空来接待,10几亿人民不知道排队到何年何月。现在有个CDN公司,将尸体一摸一样地复制了几万份,分发到全国各地,甚至某些乡镇都有。于是,人民无需背井离乡、长途跋涉远赴京城,奔丧之需又丝毫不受影响。
$ M9 w: i, d& n A3 ?! i3 b, y Q& m+ i! K5 f
2 i: Z6 }4 O1 P/ h8 |' h& x& l/ `10,动态CDN( u- ]( w/ _; b( o
$ B9 `. ^+ X( V5 [7 B; @
6 o- m3 S/ h. z# p [- ?4 E. K2 ?
前面说的CDN目前主要使用在更新频率很低(甚至几乎不作更新)的静态(静态化)内容上。比如,上面的遗体,复制几万次而不影响大家哀悼,是因为复制品和原品一摸一样(至少人民感知不到区别)。如果是个活人,身体、穿着、神态等天天在变,要保证复制品质量的话,就得不停的更新,那样会导致很多运输在途的复制品变成废品。现在的动态CDN技术,能将复制频率以及向全国分发的时间,缩短到用户无法感知的程度,已经有部分公司尝试使用(价格昂贵)。
C1 J4 d- U6 C9 S- M& E& a: H) v3 G# L
' t" _- ~4 g4 s# B G6 D" d
11,带宽的单位
) M* v2 [7 W0 ?$ o, N" U' A# t( `& R( p0 {( y* E/ q
9 D4 ~1 |! a' P假设上面说的问题都解决了,家里10兆(10M)的带宽,下载东西时,你会发现,怎么最多也只是1.25M/秒?那是因为,服务商说的带宽(字节)单位,是bit,而我们电脑上,使用的单位是byte。1byte=8bit,需要将他们的说的数字,除以8。电脑里显示某个文件的大小时候,使用的也是byte。(雪球 梁剑)4 U7 f1 F8 c; K2 e! z: V
3 X+ ]9 f0 c$ t& k& U2 s7 @1 `& L7 ~* A
2011-12-29 18:02 来自雪球
3 _$ l% h5 V/ g6 f |