数据存储产业服务平台

对话么石磊:服务需要同理心

各类MBA管理理论、服务设计体系甚嚣尘上,炒得热火朝天,而与么石磊博士谈天过程中却确实实在在感受到,只要站在用户角度考虑,数据中心系统的方案设计、实施以及运维会自然完善用户需求,在寻求差异化、服务为王的时代,亦可以享受无定律的乐趣。本期对话并行科技方案总监么石磊,听方案设计及服务的门道。

并行科技 方案总监 么石磊,1999年毕业于清华大学工程力学系,获计算流体力学(CFD)博士学位,先后在中国科学院计算机技术研究所、美国SGI公司任职,在加盟北京并行科技有限公司前曾历任IBM大中国区高性能计算销售总经理、联想集团大客户部HPC&Cloud解决方案总监等职,全面负责HPC相关的销售与技术支持相关的业务。

并行科技:一般IT方案设计需要遵循哪些原则?除了改善质量、提高服务效率、降低成本等,还有哪些是用户关注的?又将如何实现?

么石磊:说到服务,其实并不一定要遵循所谓的体系和定型的理论,而服务最重要的原则就是在与用户接触过程中时刻保持同理心,把自己当做用户,充分利用你的专业知识和经验,自然可以实现完善的方案设计。

我们并行科技的定位是服务公司,我们开发的软件产品和数据积累也都是为更好地服务于客户而提供的工具和数据支撑。

方案设计是IT建设的第一步,就是所谓的‘服务从设计开始’。

用户建设系统之初,通常会走一整套流程,包括预研、可行性研究、预算申请、方案设计、定招标指标、公开招标、合同、采购等等。

从预研到采购整个流程有时会历时几年之久,方案设计服务从预研阶段就可以开始,我们深耕行业多年,了解整个IT的发展状况;同时,作为独立于硬件厂商的服务公司,我们可以时刻与客户在一起,切实从客户需求出发,利用我们的经验设计出最佳方案。

并行科技:IT服务从设计到实施、运维,最大的挑战在哪个环节呢?哪些挑战另您印象深刻?

么石磊:在设计阶段,收集相关行业资料及行业发展动态等环节都不难,挑战在于根据用户个性化实际需求设计方案,客户的需求各有特色,而用户对自己的业务需求通常又很难量化。

例如客户建了一套系统提供给很多用户做计算,出现系统资源不够的情况,但是资源要扩充到什么程度才够用、目前系统运行效率是否最佳,这些数据通常客户自己很难给出个量化的需求,这样就需要我们利用应用特征分析工具,帮用户做统筹分析、定量分析,给出相应的解决方案,并且要考虑在未来几年内都可以满足用户的运算要求。

高性能计算系统,以及大数据、云计算技术等等,涉及到成百上千节点,系统架构非常复杂,上升到一定规模后存储、服务器间的网络架构也变得更加复杂,这些不仅要根据实际应用情况设计方案,随着技术日新月异,决策千里的前瞻性也是必不可少的。

系统实施以及后期运维的难易程度,往往取决于设计的质量,服务从设计开始的意义也在于此。设计如果有问题实施阶段麻烦就很大,最大的挑战就是要在实时更改设计,甚至重新设计。

举例来说如果系统架构设计得不完善,实施起来难度就很大,如果严格按照前期的设计进行系统部署,那么很可能就达不到客户的要求;而这时候再对方案做大的调整基本上是不可能的,这对服务供应商来说挑战是最大的。所以,我们提出服务从设计开始,务必要做到方案设计不出现大的纰漏。

实施过程中,IT技术经验和数据积累是基础。包括对系统管理、作业调度、文件系统等各种系统软件,不同的厂商都有不同的集群软件,服务商都要了如指掌才能谈及高质量实施。对应用软件的熟悉程度也决定了实施服务的质量,计算机系统毕竟是基础设施,要针对应用软件的特征对系统进行调优才有意义。在这一点上,并行科技拥有业界最全的应用特征指数库,系统的实施和调优完全可以做到以应用最优化为导向。

运维服务是第三个阶段,这个阶段很难再对系统基础设施做大的改变了,所以运维服务会侧重于保持系统稳定运行,再深一个层次就是保证应用软件在系统上高效运行。

从以往的运维服务经验看出,即使一个系统已经建设起来并经过了充分的调优,但在用户使用过程中仍然会出现很多不可控的因素,例如作业提交过程中出现用户的操作错误,导致作业低效率运行等等,系统管理员通常是很难发现这些问题的,这时候就要通过Paramon等应用运行特征监查工具去时时发现问题,并提示调整。

综合以上三个阶段,每个阶段都会有相应的挑战,设计是基础,决定了整个项目的成败;实施的核心在于系统调优和与应用的匹配;而运维的价值在于系统的高效利用。

并行科技:如Gartner副总裁David Cearley所说那样,现在的重点转移到移动用户,这些用户被超越传统的移动设备所包围。移动设备愈加普及的今天,您认为是否会给IT服务带来变革?

么石磊:说到移动要从两个层面看,首先是移动改变了用户使用习惯。例如并行科技开发了业界第一款移动端APP——ParaAlarm,利用这个移动工具,系统管理员可以随时查看系统的使用状况;最终用户可以随时观察作业的运行状况,实时查询作业运行状态,收到作业的报警信息和运行完成信息等。所以,移动技术给客户带来的好处也是不言而喻的。

从另外一个层面来看,移动技术是科技发展的必然趋势。作为服务供应商,不只是要跟得上趋势,而且是要走在趋势前面,主动求变来提升服务质量。移动要求更坚实的技术基础,需要投入资源进行工具的开发;移动也要求服务商改变传统的服务思维,利用移动设备将服务延伸得更广,响应更加及时,从而大幅提升服务质量,这必将带来服务方式的变革。

并行科技:提及IT方案设计,您又有哪些经验和关注点可以与我们分享?
 
么石磊:我们追求方案设计的干净清晰、完善、节省成本等等都是基础,而最大的原则是从客户需求出发,为充分满足客户实际需求而进行方案设计。

有时候客户可能只有一个粗略的目标。设计则要考虑得更多,在满足业务需求的同时,考虑到系统部署阶段可能遇到的问题,还要考虑到系统上线后如何方便系统运维、如何适应用户的使用习惯。

所以,方案设计不仅仅是计算机系统的体系架构设计,可能还会包括客户业务流、数据流的设计。

好的方案设计是以深厚的技术和经验为基础,是责任心和技术能力及经验的综合体现。

并行提出的服务理念,是要主动发现问题、提示预警、主动修复问题,而不仅仅是在用户发现问题或提出问题后被动提供支持。现在我们可以做到服务人员7*24小时为客户远程监控系统状态,主动推送系统报警信息,和应用运行存在的问题。

例如磁盘满了、应用将内存耗光了,作业的多个进程在争用同一个CPU核,或者某个应用程序没有用InfiniBand高速网络,而是跑到以太网上了等等。

如果没有类似Paramon的工具和系统化的检测流程,有些问题即使是系统管理员在现场也很难发现。系统管理员虽然看到作业在跑了,资源利用率也很高,但是某些细小问题就有可能造成的计算资源巨大浪费,并导致作业的低效运行,这些小问题都可能轻易地逃过系统管理员的法眼。

服务人员的责任心也很重要,即使是系统正常运行,但是当运维人员觉得应用的低效运行在浪费用户机时和计算资源的时候,就会提出来。做好服务的原则就是把自己当做客户、或当做客户的顾问,要站在客户角度考虑问题。
没有花样繁多的设计,而是大道至简,同理心最重要。满足用户实际业务需求是根本。

归根结底,IT是实现业务需求的基础设施、工具,做服务的最终目标,就是从客户痛点需求出发,解决实际问题。真正实现,‘IT放着我们来,你只专注业务就好。’

未经允许不得转载:存储在线-存储专业媒体 » 对话么石磊:服务需要同理心