文/谢世诚
Ceph在国内的应用从2014年开始走强。
迄今为止,Ceph在金融(如恒丰银行,平安科技)、政府行业、互联网(如金山云、阿里、腾讯、京东、携程)、能源行业(如国家电网)、交通行业(如中铁总)、运营商(中国联通、中国移动、中国电信)、高校(上海交大、武汉大学)、媒体娱乐(人民日报、今日头条、YY直播、虎牙直播等)、公益(福彩)、游戏等行业得到了广泛的应用。
谈及Ceph的成功案例,Ceph中国社区联合创始人耿航如数家珍。
Ceph之所以能取得超出其他很多社区的效果,除了作为开源社区拥有广泛生态的因素,另一个重要的原因在于其技术本身——不仅跟OpenStack结合紧密,而且因其“软件定义”的设计理念推翻了分布式存储“一个存储只能解决一个问题”的观念,对比以往Swift、GlusterFS等单纯支持块、文件、或者对象存储的功能,Ceph以一套软件实现了多种存储接口,从而减少了使用者的学习成本和维护的复杂度。
凭借其高可靠、高性能、易扩容三大特性,Ceph无疑将在更多的领域得到更加广泛的应用。
虽然Ceph的市场规模尚无官方结论,但据Ceph中国社区联合创始人孙琦粗略统计,市场上70%~80%的云平台都在采用Ceph作为底层的存储平台。
英特尔中国云计算战略总监陈绪认为,Ceph已经成为开源云平台的标配。
(从左至右:)Ceph中国社区联合创始人孙琦、耿航与英特尔中国云计算战略总监陈绪
在Cephalocon APAC 2018召开前夕,DOIT记者就相关技术与市场话题,与耿航、孙琦及陈绪三位大咖进行了沟通。
DOIT:Ceph社区提供了RHEL、Ubuntu发行版等多个版本,这些版本之间有什么不同?
答:的确,Ceph社区发布了多个版本。在开源社区,不同的人做不同的工作,这个包我编译一下,就是RHEL,那个包里他编一下,就成了Ubuntu。在编译和打包的过程中形成了不同的产品。但根本上,它们都基于Linux统一内核,能运行于几乎所有x86服务器上,区别主要是应用层和中间件的部分。
市场上,几乎所有的Linux公司,包括Suse和Red Hat,都有Ceph发行版。这说明每家公司都很重视Ceph,都把它当作未来的发展战略。
DOIT:用户自行下载Ceph发行版使用,需要注意哪些问题?
答:用户下载源代码,或者是发行版,都离不开一些优化工作,需要多去借鉴别人的经验,让它更好的部署在自己工作的环境里。实际上,部署不是难事,难点是调优与运维,后者需要更多的精力。
以开发传统应用和开发分布式应用为例,二者最大区别是什么?最简单的是,以前开发Java程序,开一个窗口就可能把程序写完了;但是开发分布系统,很可能需要开七八个窗口一起联调,因为每一个流程进展都不一样,而且需要在不同的服务器上调整,这也意味着开发成本跟以前的大不相同。
所以,开发者更愿意听取实际的案例,以实际案例来参考应用。
DOIT:Ceph在一个统一的系统中同时提供了对象、块和文件存储功能,在实际使用中,这些功能是否能够拆分出独立的系统?
答:统一提供这三个功能,这正是Ceph的巧妙之处。自然,单独采用其中某一个功能,就更加没有问题的了。
在不同技术领域的公司,有专注于块的,有专注于对象的,还有擅长文件的。在实际的使用过程中,很多案例都是独立的使用的。Ceph最早是对块级别层面的支持,然后支持文件系统项目,再后来支持对象存储。在对象存储领域,Ceph大有替代Swift的趋势。
DOIT:除了Ceph之外,我们还知道有Swift、GlusterFS等很多公司自己研发的技术。相比之下,Ceph突出在哪些方面?
答:GlusterFS最早是以分布式文件系统为主,早期国内也有很多GlusterFS研发投入很深的公司。
为什么没发展起来?这一方面跟Ceph提供的接口的丰富性有关系,另一方面,是后者不如Ceph那样做到了OpenStack内核里面,跟OpenStack整合到浑然天成的程度。
从个人角度,Swift在OpenStack体系里面的地位比较尴尬。OpenStack最早期的一个项目就是Swift,但是这个项目没被真正的应用起来。国内一些创业公司也在用Swift去提供对象存储类的服务,但更多的是脱离于OpenStack体系去单独去做一个个产品。
OpenStack Swift当时是为了对标AWS的S3,后来人们发现Ceph也能实现相应的功能,所以更多人就转到Ceph去做对象存储。
当然也有人诟病Ceph,对在不同的应用场景以一种底层技术来实现提出质疑。但是这不阻碍Ceph的发展。Ceph今天能得到广泛的应用,说明业界对这种方式也是比较认可的。
DOIT:与传统SAN、NAS相比,Ceph的主要优势在哪里?
答:去年曾有一家银行客户说,在未来三年之内,银行80%的NAS场景将会被替换为对象存储。对NAS来说,可扩展性是一个硬伤,而这正是Ceph所具备的天然优势。
可扩展性面临的挑战,一方面是资金不足的问题,因为扩容成本比较高,而且厂商之间的不同产品还存在兼容性问题,另一方面是技术问题。在以往的某些场景中,系统接近满载时候,存取的效率就会很低,低到让人无法忍受。
Ceph的分布式存储方式实现无缝的扩容。这对于商业化存储而言是最大的一个冲击点。
DOIT:当前Ceph技术是否存在突破口?如果有,会是在哪里?谁来完成?
答:Ceph并非尽善尽美的。例如,Ceph的纯文件系统部分Ceph FS(Ceph的一个组件),发展不是很成熟,尽管一直在改进,但还远没有达到心目中理想的稳定程度。由于其应用场景广阔,所以目前浪潮、杉岩等很多厂商都在发力。Ceph FS将是未来的一个突破点,还有很大的提升空间。
网站社区也有很多人都在贡献,相信会取得更多的突破。这也是开源社区一个良好的机制。
一个健康的开源社区,特别是一个技术社区,成员的核心价值就是对代码的贡献,从提供满足市场未来需求,并从各方面对历史和传统的应用软件提供支持的过程中找到成就感。
在对象存储的基础之上Ceph提供对块和文件支持方面,英特尔就是提供了一个叫CeTune的工具,帮助志愿者找到一些瓶颈方便调优。
这种贡献不局限于跟英特尔本身的技术,比如CPU、SSD、NVMe等,还有新的存储介质与技术,英特尔更多的从产业发展的角度来填补一些缺陷,对整个Ceph国际社区提供代码贡献。
例如,英特尔提供的一个叫SPDK的开发包,它的全名是Storage Performance Development Kit,作为提升存储性能的一个开发套件和工具包,它创造性地把I/O和一些调度、存储等在Linux内核里进行的计算迁移到用户台。这是对Ceph设计架构的一次革命性的创新,使得Ceph整个系统的性能得到飞速的提升。
英特尔开源技术中心的领军人物叫王庆,最近四年以来他一直连任OpenStack基金会个人董事,在Ceph中国社区也带着一支团队,并且做出了很大的贡献。
DOIT:社区工作需要占用大量的时间,作为志愿者,三位如何处理好与本职工作的关系?
答:最好的工作就是把兴趣和本职工作结合起来。在Ceph层面,我们基本上达到了这个境界。
作为英特尔战略规划部门,我们必须比别人看得要早一些远一些。早在2012年,英特尔就和三家公司联手创立了中国开源云联盟。这在当时很难被人理解和接受,甚至被误以为是不务正业。
对于我们来说,只要是创新的、有发展前景的,都可以纳为工作的一部分。不能拍脑袋想市场,得看市场。要看清楚谁会是优胜者,保证在他成功的时候,你跟他能站在一起!
DOIT:谢谢!
【号外!3月22日-23日,由Ceph中国社区和DOIT,存储在线联合举办的全球首届Ceph亚太峰会 —— Cephalocon APAC 2018 将在北京JW万豪酒店盛大开幕!】
详细日程及报名参会请扫描下方二维码: