数字信息每天在无线电波、电话电路和计算机电缆中川流不息。我们周围到处都是数字信息。我们在高清电视机上看数字信息,在互联网上听数字信息,我们自己也在不断制造新的数字信息。每次用数码相机拍照后,都产生了新的数字信息,通过电子邮件把照片发给朋友和家人,又制造了更多的数字信息。
显而易见的事例太多了。YouTube公司几年前还不存在,现在每天通过其网站传送的视频多达1亿份。专家们说,每天通过互联网共享的MP3歌曲超过10亿首。这是一个数字比特的世界。伦敦的200个交通监控摄像头每天向总部数据中心发送64万亿个数字比特。Chevron公司的首席信息官说,Chevron公司的数据在以每天2TB、也即1.7592×1013个比特的速度增加。到2010年,世界上大多数国家的电视广播都将全面实现数字化。数字比特在不断增多。
不过,我们不知道的是,这些数字比特总共有多少?数字比特增加的速度有多快?比特激增意味着什么?
人们制造、获取和复制的所有1和0组成了数字宇宙。这份白皮书是IDC公司对数字宇宙未来发展的预测。IDC同时分析了数字宇宙的未来发展对身处其中的人们和公司可能产生的影响。人们通过拍照片和共享音乐制造了数字比特,而公司则组织和管理对这些数字信息的访问和存储并为其提供安全保障。这个研究项目是由EMC公司赞助的。
•2006年产生、获取和复制的数字信息总量为1288×1018个比特。用计算机用语来说,就是161EB或1610亿GB(见“什么是比特和字节?”部分)。这大约是有史以来出版的图书信息总量的300万倍。
•从2006年到2010年,数字宇宙的信息量将增长6倍多,从161EB增加到988EB。
•三种主要的模拟数字转换为这种增长提供了动力:用胶片拍摄影像转换为数字影像拍摄、模拟话音转换为数字话音以及模拟电视转换为数字电视。
•从数码相机、相机电话、医用扫描仪到保安摄像头,全世界有10亿多个设备在拍摄影像,这些影像成为数字宇宙中最大的组成部分。这些影像通过互联网、企业内部网在PC和服务器以及数据中心中复制,通过数字电视广播和数字投影银幕播放。
•IDC预计,到2010年,数字宇宙中有近70%的信息由个人建立,而机构(各种规模的企业、服务代理机构、政府部门、协会等等)将负责管理至少85%的信息,负责保证这些信息安全、可靠并符合法规规定以及保护这些信息的隐私性。
•这种迅速加重的责任将给现有计算系统带来压力,并促使机构开发更加以信息为中心的计算架构。
•IT经理们会发现,他们的职责范围极大地扩大了:VoIP电话成了企业网络的一部分、楼宇自动化和安全保障系统进入了IP网络、监控系统实现了数字化、RFID和传感器网络在激增。
• 随着企业与客户的实时联系越来越紧密,信息安全和隐私保护将成为企业高层关注的问题。因此除了需要进行新的培训并制订策略和工作程序以外,还需要实施新的安全技术。
• IDC估计,今天数字宇宙中有20%的信息受到法规和标准的制约,大约有30%的信息可能与安全应用发生关联。
• 访问企业数据的人群会变得更加多样化:员工移动工作的机会越来越多;各公司都在实施客户自助式服务;全球化使得客户和合作伙伴关系多样化并拉长了供应链。
• 数字宇宙的发展是不均衡的。新兴市场?D?D除日本之外的亚太各国以及除北美和西欧以外的世界其余国家现在在数字宇宙中占10%的份额,但是这些国家的增长速度将比发达国家快30%到40%。
• 2007年,人们建立的信息量将首次超过可用的存储容量。
数字宇宙令人难以置信的发展意味着一个极为简单的事实,我们每个人都将面临规模空前的信息爆炸。对机构来说,这意味着需要保护隐私、数据安全和知识产权,进行内容管理和信息管理以及采用合适的技术和数据中心架构。
数字宇宙中比特的增加及其异构特性意味着,世界各地的机构,无论大小,只要它们的IT基础架构在传递、存储、复制这些比特并在保护这些比特的安全,那么这些机构就别无选择,为管理、搜索和存储信息并保护信息的安全,它们只能实施越来越复杂的技术。
我们是怎样得出这些数字的?
有关我们采用的方法和基本假设条件,在“方法与主要假设条件”一节可以看到。我们的基本方法是:采用IDC的预测数据,即IDC对个人计算机、数码相机、服务器、传感器等产生或获取数字信息的设备的预测;估计这些设备在一年中获取或产生数据的总MB数。我们根据IDC的研究数据和其他资料做出估计,看这些数据有多少通过电子邮件附件、归档文件、广播等进行了复制。
我们以前在加州大学伯克利分校开展过一个研究项目,此次研究是伯克利项目的延续。尽管我们这次采用的方法与伯克利项目有所不同,但是很多基本假设条件是相同的。伯克利项目只研究了原始信息的产生(不包括复制),并估计了如果所有这些原始信息都转换成数字格式后,会产生多少数字信息。
用我们这次采用的方法,可以确定和预测数字宇宙中产生和复制的所有信息、可以分地区研究信息的产生与复制并结合可用存储容量来考虑问题。我们相信,这是有史以来第一个确定和预测整个数字宇宙扩张速度的研究项目。
什么是比特和字节?
“比特”是可以存储在计算机中的最小信息单位,由1和0(或接通/断开状态)组成。所有计算机都以比特形式进行计算。
“字节”是8个比特的组合。因此1个字节是1个比特的8倍长。用字节很方便,因为转换成计算机代码时,字节可以代表256个字符,如数字或字母。
人们常以1000的倍数来表示字节量,如千字节(KB)、兆字节(MB)、千兆字节(GB)等。这些单位之间的进位关系如下:
比特(b) 1或0
字节(B) 8bits
千字节(KB) 1000B
兆字节(MB) 1000KB
千兆字节(GB) 1000MB
兆兆字节(TB) 1000GB
1015字节(PB) 1000TB
1018字节(EB) 1000PB
1021字节(ZB) 1000EB
这似乎很简单,但实际上字节的倍数应该是2的幂,因为原始的计算机语言只有两种状态:1或0。KB是210字节或1024字节。MB是220字节或1024KB,依此类推。
为简单起见,在本次研究中所有计算都是基于10进制系统即上面列出的进位关系进行的。这与伯克利项目所用的表示方法是一致的。