说工作负载优化和海量数据处理,肯定让人摸不着头脑,但是如果说到前不久在《危险边缘》(Jeopardy!)智力比赛中完胜人类的超级计算机“沃森”(Watson),大家就耳熟能详了。“沃森”超级计算机没有连接网络,凭借强大的Power 7计算平台和智能算法在后台庞大的知识海洋中分析问题主旨,并筛选出合适的答案——3秒内作答。
那么“沃森”的超前和领先的技术真正含义又在哪里呢?IBM中国研究院的张雷表示,“沃森”的真正挑战在于理解问题的真正含义,正确比对数据库,并且在诸多信息中去伪存真找到正确答案。而这一系列比对数据库,正好与商业计算中的海量数据处理类似,因此“沃森”实际上证明了IBM在海量数据处理中的强大实力——这种实力来自软件算法也来自支撑计算的基础架构平台。
一、四路领域完胜 Power商用计算潜力广阔
从官方公布的数据来看,“沃森”内部使用的的是市面上买得到的90台Power 750四路小型机。也就是说,每台Power 7服务器拥有四个8核Power 7处理器,构成32个计算内核,而“沃森”也就拥有了2880个Power 7计算内核(360个处理器)。在聚合了如此多的处理器之后,“沃森”完胜了人类,那么单独一个Power 7节点的计算水平呢?
在早先的测试中,我们可以看到四路IBM Power 750完胜同类四路对手产品,在一系列浮点计算和面向数据库计算的模拟中Power 750无疑是当前世界上最快的四路服务器。
▲
跟高端系统类似,四路的Power服务器也同样拥有竞争产品更多的内存、I/O,以更好地支持服务器整合。这主要得益于Power 7自身的四大特性:
1、eDRAM三级缓存带来超高性能
所谓eDRAM顾名思义,就是指嵌入式动态随机存储器(Embedded DRAM),它有两方面的好处。首先是eDRAM本身比目前广泛使用的SRAM缓存具有更高的速度,更高的密度以及更低的功耗。根据IBM的官方数据,eDRAM只需要传统SRAM三分之一的空间,五分之一的功耗就可以获得同样的缓存容量,并将错误几率降低250倍。
eDRAM与逻辑晶体管全兼容,且逻辑性能不会退化。IBM Power 7处理器集成了高达32MB的片上L3级缓存,较片外缓存延迟只有1/6,带宽则提升了两倍。我们知道,处理器执行计算需要依次在L1、L2、L3缓存中查询数据,而缓存越大使得查询"中靶率"越高,Power 7中的32MB L3级缓存可以说将这种思路拓展到了极致。
2、SMT4智能的并发多线程
并发多线程技术(SMT)大家已经不陌生,但是与以往单一物理内核能分出2个逻辑线程并行计算不同,Power 7中的SMT4将每核心的多线程数量从以前的2线程提升至4线程。而且处理器可以智能的根据应用需求在单线程,双线程和4线程之间动态切换自身的线程数量,以获得最佳应用表现。
所谓智能并发多线程,指的是IBM Power 7不是每颗核心4线程,而是智能的根据应用调整线程数量–在面向繁多的"碎小计算"时转入SMT4模式,8核32线程最大并行计算;而面向大规模单线程计算任务时,转入SMT1模式,8核8线程,最大化的使用每颗内核进行计算。
IBM官方数据显示,当负载能够受益于多线程时,SMT2模式较SMT1提升50%,SMT4模式较SMT1提升80%。
3、Turbo Core模式将全部资源集中
对于"沃森"来说,海量数据的瞬时分析,一方面考验了并行计算特性,另一方面也对线性计算的次序提出了严格要求。也就是说,如果"沃森"通过并行计算检索了很多数据,又如何能进行比对并筛选出答案,进而抢答–这就需要组成"沃森"的"细胞"–Power 7服务器在两种情况下都具有超强性能。
Turbo Core模式最大特点是根据应用负载的变化,自动关闭Power 7八个核心中的四个,将缓存、带宽资源全部分配给剩下的四个核心,并动态提升主频。举个形象的例子,8辆车(8个核心)在高速公路(相当于带宽)上跑,现在退出了4辆车,于是变相等于剩下4辆车的路(带宽)变宽了–而那4辆车的汽油(CPU内供电)也给了剩下的车,于是发动机可以超负荷工作(提升主频)跑的更快了。此外,剩下的4辆车还获得了全部的货物(缓存)。
对于数据库和事务工作负载来说,计算的并行度并不是掣肘的因素,因此IBM在Power 7中会用"牺牲其他4核"的方式集中所有资源给剩下的内核,以提高计算强度。另外,从目前日趋流行的虚拟化和云计算发展来看,减少处理器内核有助于降低虚拟化软件的收费;而云计算也是按需付费计算核心数量,这样在获得较高数据库性能的同时,降低了成本。
4、AME技术将可用内存拓展100%
AME技术全称是Active Memory Expansion ,是从POWER7开始支持的一项新的内存虚拟技术。它通过内存数据压缩的方法,在已有内存容量不变的基础上,为服务器开辟更多的LPAR,或是提升LPAR性能。"沃森"同时处理海量数据检索,对内存需求达到了无以复加的地步–这几乎是一个追求极限性能的计算项目–与人脑对抗。
据IBM透露,在SAP应用测试环境下,Active Memory Expansion可以将内存量提升50%,该技术将使得之前受到内存容量限制的同性能服务器多处理65%的交易处理或用户量。在Power 7系统上,AME技术可以让SAP等内存密集型应用程序将目前的内存多认出50%,而有效扩展推度可以达到100%。
那么除却性能外,商业计算领域的客户也很在意计算的可靠性、可用性和可服务性(RAS),而这一特性也是制约x86平台发展的重要因素–却是Power 7的强势所在。在POWER7中,IBM引入了许多新的RAS特性,包括Processor Instruction Retry、Alternate Processor Recovery、Partition Availability priority、Live Application Mobility和Live Partition Mobility等。这些特性的主要目的都在于消除系统计划内和计划外的宕机时间。比如,当你将一台服务器关闭以进行重配置、固件升级时,你需要在不对生产造成影响的前提下把这台服务器上的应用迁移到其他服务器上面去。
下表全面比较了POWER、SPARC、Integrity、Xeon在重要RAS特性上的差异:
▲
最后,技术升级情况也是商业用户选择平台的重要因素。IBM在POWER 7系列产品中投入了超过32亿美金做研发,确保了持续有力的技术升级。而相继的产品升级也在规划中–据透露,POWER 8将于2013年上市。另一方面,结合新产品的新软件解决方案也能及时跟上,包括新一代的AIX操作系统、新一代PowerVM与PowerHA功能等,都与新品上市紧密相关,这无疑给了用户坚定的可持续购买POWER系统的信心,也让POWER系统的竞争优势更加明显。
从"沃森"的胜利我们可以看到小型机在人工智能方面的潜力–通过优化和整合实现超强的计算能力,为人工智能所需要的分析能力奠定基础。同时,IBM Power 7系列全面的产品线布局,也让我们意识到,在小型机和x86服务器的应用领域界限日渐模糊的今天,除了x86服务器正在不断改进性能,试图向高端市场渗透,小型机也将通过其低端产品及其高RAS特性的优势,向x86市场横向拓展。
二、业务分析与优化应用场景剖析
Watson的出色表现,离不开业务分析与优化软件技术的支持。正是其强大的商业智能和分析能力,才成就了Watson的强大计算和数据处理能力。下面,通过几个业务分析与优化的应用场景,来了解业务分析与优化的强大作用。
1、信息情报决策好助手
公安干警在案件侦办过程中,需要大量数据和数据处理作为依托,但当前公安情报信息应用普遍缺乏足够的灵活性与智能性,表现为:多系统存储的孤立数据,影响了干警对案件的全面了解;在线索处理过程中,办案人员的专业经验不能被有效积累和复用;信息处理极大依赖IT人员,可能形成瓶颈,造成线索难以被及时发现和利用。业务分析与优化可以帮助公安干警处理大理的数据并给出及时、正确的决策。
2、食品安全:理论模型与工具
业务分析与优化倡导科学的管理理念和先进的物联网技术,以风险与分析为基础,保证食品安全与追溯平台的可持续发展。
其原理是基于食品追溯网络,对食品生产、加工、流通、消费的全过程中可能造成食品污染的各种危害因素进行系统和全面地分析;从而确定关键控制点,并根据投入与风险调整价值,优化每个关键控制点的限值,如采集什么数据,数据源在哪里,采用什么格式及标准,以及采集频率等;进而在关键控制点对危害因素进行控制,并对控制效果进行监控,当发生偏差时予以纠正,并提供相关数据分析服务。
3、医疗防欺诈与滥用管理系统(FAMS)
IBM防欺诈和滥用管理系统帮助医疗保险支付机构识别那些可能存在欺诈、滥用和浪费行为的索赔者,进而抑制这些不良行为,挽回巨额经济损失。医疗防欺诈与滥用管理系统(FAMS)使用了先进的分析和统计学方法,同时内置定义了藏族行为模型,涵盖了医学领域的20多个学科,定义了超过2000多种分析指标,并且可以按照客户的具体需求进行裁剪。
4、智能停电计划优化
停电计划管理是电力企业日常运营的核心工作之一,对企业的安全有序生产及提高用户的用电可靠性具有重要意义。当前电力公司生产计划管理工作面临众多挑战,如任务来源多、约束条件多、牵涉部门多等等。通过建模分析计划目标及约束、结合复杂电网拓扑信息、优化停电计划、将促进电力公司提升集约化、精细化管理水平。智能停电计划优化,帮助电力公司提升了供电可靠性,减少了停电计划变更,提高生产均衡性,减少设备重复停电,同时也提升了客户满意度。
5、智慧的城市水管理平台
目前,城市水管理面临的挑战有水资源短缺、水灾频发,水环境恶化,可靠性低、泄漏率高,能耗高。智慧的城市水管理平台可以帮助城市水管理绩效仪表盘系统保证全程可视可控,以及在管理运作环节的分析优化,从而保证稳定运行,提高动作效率。
6、新能源分析与预测
新能源发电具有间歇性、随机性、可调度性低的特点,而电网运行需要保持发电量与用电量的实时平衡,大规模新能源接入后会对电网运行产生较大的影响。这种不确定性已经成为新能源发展的主要瓶颈,它导致20%以上的能源浪费。新能源分析与预测解决方案是基于高精度天气预报模型对微观区域内云层、降雨量、风速、风向、气压、温度等快速和准确预报。同时基于天气预报结果,结合电厂布局,机组特性和历史数据,实时预测见机出力和光伏发电功率。高精度的天气预报和发电预测可以提高电厂规划建设的科学性,电网接入的稳定可靠和机组的合理利用。