3 i; v+ v1 E* H- _( d(不久前,和@范卫锋 聊天,谈到我们作为技术的外行,怎么去了解一些基本的互联网知识,于是计划将一个外行人对技术的理解,写下来。某些概念和原理的解释可能不太准确,另外和投资没有直接关系,供其他转行、跨行同学参考。); e3 ^5 ~1 w9 ~) n: e4 y
3 h. Z/ J7 c! \ u第一篇:带宽常识 我家是10兆的宽带,上网为什么巨慢?
9 E- G* q2 S" e
8 C t9 Z! {0 o( {( a8 t, L* @* \$ k9 L6 ^- ~" J
如果问题是“我们小区里面是双向10车道,为什么上班路上还是堵车呢?”答案很明显,小区不堵车,但我们的上班地点,出了小区,还得老远的跑到中心区CBD去。你家里的10兆宽带(如果有的话),只是从你家到网络接入商的带宽,不等于到所有地方都是这个速度。! k6 C+ k: w9 E; Z' w) z
. a2 y! w K/ O1 K# P8 a! ^
- ^1 Y' T$ c; Z# Y- K+ ?0 m* I" A: g. m
7 P/ h7 m% k' T3 L5 u上网快慢,涉及到几个问题:你的电脑;你的网络接入商;你希望使用的互联网服务(简单理解为要访问的目标网站吧);目标网站的系统;目标网站所在网络环境。 8 T5 Q8 L0 y: e# t
9 S3 A; j* R+ R! G* A0 V/ v+ H2 j; x3 n7 |
1,跑车还是拖拉机?8 N' i, M# N) K& a
$ `$ R, A9 O( f: c- N1 {6 B& b
q8 v8 a4 b+ ~$ X L0 u" h2 ?
影响网速的因素,首先要看,你的电脑配置是不是太落后,是不是中了木马、流氓软件等。是不是同时使用了太多耗费带宽的服务,比如看视频,下载大文件等。3 V, [! ]( v5 k& X: s
! A& F5 n" S: J" v4 }$ c
; h* ^8 J3 ]: r& I! R6 x
, r" B) H0 f5 e3 T% Z2,网络接入商% o2 i- W" {1 i" T" Y( l
' r( {* R% l/ R; h. j7 n! G6 ]
5 h! J) Z# z n# o
简单来说,就是能牵线到你家里,然后让你的电脑上网的那个公司(现在也有无线的方式)。由于历史的原因,以前只有中国电信能为普通用户提供这种服务,所以现在最大的接入商,仍然是中国电信和中国网通。其他大大小小的各种接入商(比如长城宽带、E家宽、歌华有线等),可以看作是前两者的分包商。这些可以统称ISP (Internet Service Provider),互联网服务提供商。: B4 P" w; [) \+ ]' z
3 z" O6 `: S% l) t+ a. s
" S/ {% ~& @$ s) k! |) M5 b
3,目标网站7 ~( O- z" N5 U" R, A2 |
' g0 k7 o4 ?" L" K/ C9 F7 X
* H9 M4 K9 g" C2 ?
作为上班一族的你,中心区是你经常去的目的地;而上网的话,目标网站的服务器在哪里?同样由于历史原因,绝大多数都在中国电信或者中国网通的机房里,也有部分公司,通过从电信、网通租赁一些带宽,自建了机房,再向外提供服务。这些都叫IDC(Internet Data Center),即互联网数据中心。
: Q2 c1 P6 n/ h8 s3 Y; j/ k. C" P# @- x( A! f
# [" @9 r) G# i9 p( m' N) d4,目的地是小区还是中心区?( ~, g ~1 j8 d9 @$ u0 A
. T, h5 {/ y4 v4 D* @
$ ?' x* V$ ^+ m; K假设你的接入商是长城宽带(简称长宽),10兆(M)入户。或者,从你家到长宽的骨干网,的确有10兆(也就是小区内的10车道)。问题是,你经常访问的是新浪、网易以及雪球等网站,而这些网站的服务器不在长宽。于是,如果长宽的用户越来越多,而长宽与电信、网通之间的接口带宽没有相应增加的话,网速就越来越慢。所以,即使是相同的带宽标准,不同的接入商,与你实际使用到的带宽差别非常大。这里不得不为电信、网通做一下广告,他们的ADSL以及专线等方式要比其他接入商靠谱。& Q: e9 ]6 n. _9 k
# G# d8 B" w5 j, ? Q: {2 S1 ^' U
. z# C8 @0 w6 E5 M; H! a. |5,上班高峰期1 s. h+ k9 p4 q7 l7 C6 J
" q4 Z$ A: Y; ]% W6 C
# Z2 v9 S5 }7 @( Q3 Y: q虽然,网络接入商,不断的增加自己与电信、网通等骨干网之间的带宽(要钱的),也就是将小区出去的路修得宽一点。但是仍然难解决上班高峰期,大家一起上路的问题。所以,很多你会发现,早上起来觉得网速很快,但到晚上就不灵了。因为对小区宽带用户来说,晚上是使用高峰期。
7 U0 P5 L: g) K. `% G8 o3 x2 j3 T/ o: M" h5 | G
1 N/ z; C( @" v
6,小车还是火车?+ y- p) T1 j6 z: W7 Q# ^
0 n3 p( z% m; v7 x# p9 T
# ^* C; ] v+ k$ @% n+ R0 ]8 ~
如果你的小区有1000辆车需要开到中心区,为了不堵车,是不是得修一条1000车道宽的公路呢?当然不是,因为1000辆车不是并排一起走的,每辆车只占几米长的一小截路面,所以10车道的公路就足够了。1 _4 B j0 B6 _" G0 F h, g& I
* e, `7 M& z0 O% T" m) j
$ {% W7 e M6 B3 m但,如果这些车不是轿车,而是火车(每列车所占的路面很长),恐怕就得要几百条车道,才不会堵车了。8 q8 I2 W- [# z# f$ O" P, H) |7 i
9 R1 f) y/ G3 x+ `2 H$ g! u( v4 z, n* ?% A/ l1 A) y' {/ i
同理,假设小区里有1000户人家开设了10兆接入,接入商并非提供10兆X1000的总出口带宽。因为,多数人的上网行为,比如浏览网页,仅在打开页面极短的时间内产生高流量,而且也不是所有用户约好了一起刷页面,可以实现错峰。如果是QQ聊天之类的活动,所占的带宽也非常小。也就是说,你的10兆带宽,多数时间是闲置的。2 B& ?" M4 B6 \% z
3 r" a$ i3 [& u" S3 H) n3 A9 Z* `0 e2 z1 r& N
因此,网络接入商不会按理论最大值来配备带宽。如果平时大家都是开小车(浏览网页、聊天)还好,如果开火车,就容易堵了。进行大文件的下载(包括在线看视频)就像开火车,特别是使用P2P的下载软件(比如迅雷、电驴),因为带宽长时间被占据,如果接入商的总带宽冗余不多,少量的火车就会将出口挤爆。
9 k5 I7 f1 G! U$ z& H
# ^) N M1 J: z5 @7 @/ [
& D' w) \/ _6 G$ m+ L
' l' K6 G" _4 F' H5 a7,目标网站的系统( S/ r* x) x" C# j
, m4 H: S. m6 R/ s) c2 N! q& n# T9 P/ c7 g b
你一路飞车到了中心区,但是里面塞满了车,你只能在路口排队等。用户所能感受的网速,与目标网站所提供的服务及其质量关系极大,主要是受网站的架构、数据库读写、缓存技术、以及前端页面的编码、以及访问压力等影响。一般来说,静态页面抗压能力要比动态页面强很多,换个意思是,同样的条件下,静态页面通常比动态页面快。静态页面(或者是应该静态化的页面)可以简单理解为,所有人看到的几乎都是一样的内容,比如新闻页面;动态页面每个人看到的都是各不相同,比如微博自己的首页,或者对更新频率要求在秒以内的页面。
* R$ i( I! B! J" w
, f5 S+ J) p* U3 R) J8 `5 ~( J* [( n' [. P7 E _$ G
* X% W! \- O1 p$ P' A* {$ N8 x8 x; c8,目标网站的网络环境0 ?2 \( Z$ Z, S4 w/ t5 F$ J
4 t @+ o( T, B3 w9 ~- n/ K8 K
/ V) W; E4 u( ?6 `+ l1 Z# Y
由于各种原因,中国主要的基础网络提供商电信和联通(前网通)之间,互联互通还存在很大障碍,另外还有教育网、金桥网、中国移动等各种网络环境。如果一台服务器,放在网通的机房,电信的用户跨网访问可能较慢,反之亦然。所以,不少网站将服务器放到双线、甚至BGP机房,以解决用户跨网访问的问题。3 U+ i2 c6 I; a2 g
( W/ I6 f* {1 K! D( w
另外,由于中国到境外的出口总带宽瓶颈以及其他原因,国内用户使用境外的互联网服务,速度明显受到影响,哪怕目标服务器是在香港。! k" z0 V( L @! n8 F9 T, ` J
1 b+ Y6 S. n; N% J( d
9,网络分发和加速服务
% n1 |1 V. I c# i! j; ]% H
! P( V: A3 U2 k7 D4 w$ y+ U
0 V1 T$ D% v) D
4 H. Y( i6 _% D: w8 s3 l这个不是针对单个上网用户的服务,是网络内容服务商(简称网站运营方吧),通过网络分发和加速服务,部分地解决用户的访问瓶颈问题。也就是CDN(Content Delivery Network)。2 p6 ], l9 R7 w& r0 f' g
& c, z# |2 z4 V. |$ b8 D再看之前的例子,假设目标网站的服务器,是放在北京联通下某个机房,一个海南的电信接入的用户去请求,路途遥远。虽然在光速传输上,从北京到海南的物理距离所耗费的时间几乎可以忽略。但是事实上,由于各个接入商、各地网络环境、跨城市骨干网总带宽、以及互联互不通等问题,确实存在瓶颈。1 ?7 D5 \8 c' w/ j, S) {" A; V% g
# l+ p( n9 S7 ]" J0 e+ @3 ~9 H/ m+ `2 V; m2 c
于是有的公司(蓝汛、网宿科技、世纪互联等),在全国各地租用(或者自建)当地的机房和网络,架设了自己的全国分发系统。目标网站最终的服务器可能还是在北京,但是将内容通过他们的CDN网络向全国(全世界)分发,于是,海南的用户,直接请求当地最近的服务器的镜像数据,比以前要快很多。而别的同样在海南的其他用户,需要相同的内容时,也直接从本地最近机房读取。CDN的方式,既提供了访问速度,也节约了带宽成本。有的带宽虚耗大户,干脆组建自己的CDN网络。世界上最大的CDN服务提供商是Akamai(NASDAQ:AKAM)。
' y' e/ R9 d: u- f6 z' T( `
0 ?: K9 H& A( n1 `, o" }0 Y0 t" T. X z) i) F. j
这方式可以理解为,全国人民本来要去北京朝圣,一睹老人家遗容。按传统的方式,即使将飞机、轮船、火车、手推车等所有交通工具用上,再将北京整个城市腾空来接待,10几亿人民不知道排队到何年何月。现在有个CDN公司,将尸体一摸一样地复制了几万份,分发到全国各地,甚至某些乡镇都有。于是,人民无需背井离乡、长途跋涉远赴京城,奔丧之需又丝毫不受影响。
7 a7 `" E! Y- b ] Z6 U+ S' _( z+ _, n
2 Q- g- {6 B% M1 K8 I5 [4 H
10,动态CDN K0 ?4 M* D, P6 z4 b% R
; ?; Y: c5 B }+ I, I
" E1 j* {8 J8 ?前面说的CDN目前主要使用在更新频率很低(甚至几乎不作更新)的静态(静态化)内容上。比如,上面的遗体,复制几万次而不影响大家哀悼,是因为复制品和原品一摸一样(至少人民感知不到区别)。如果是个活人,身体、穿着、神态等天天在变,要保证复制品质量的话,就得不停的更新,那样会导致很多运输在途的复制品变成废品。现在的动态CDN技术,能将复制频率以及向全国分发的时间,缩短到用户无法感知的程度,已经有部分公司尝试使用(价格昂贵)。
$ {8 O8 ~" a: o) a [' G: Y. x% r: j
$ l3 }* u5 j' w A11,带宽的单位
4 I( f7 e/ H7 ]
% @& I! z7 s/ O% L7 s# H+ e. d# Y) D! z ]2 s+ J. y' ^
假设上面说的问题都解决了,家里10兆(10M)的带宽,下载东西时,你会发现,怎么最多也只是1.25M/秒?那是因为,服务商说的带宽(字节)单位,是bit,而我们电脑上,使用的单位是byte。1byte=8bit,需要将他们的说的数字,除以8。电脑里显示某个文件的大小时候,使用的也是byte。(雪球 梁剑)
/ y3 h. e9 O6 l4 e1 D1 v! \
; Q. c L+ ~ k) ]$ t' M" j
; r$ i7 b4 e" L' V' A# P2011-12-29 18:02 来自雪球
# S# T, M6 Q3 s: o |