数据存储产业服务平台

曙光助力百度搜索查询应用存储系统

 
     项目背景

      百度是全球最大的中文搜索引擎、最大的中文网站,拥有全球最大的中文网页库,收录中文网页已超过20亿,这些网页的数量每天正以千万级的速度在增长;同时,百度在中国各地分布的服务器,能直接从最近的服务器上,把所搜索信息返回给当地用户,使用户享受极快的搜索传输速度。
 

百度每天处理来自超过138个国家超过数亿次的搜索请求,每天有超过7万用户将百度设为首页,用户通过百度搜索引擎可以搜到世界上最新最全的中文信息。

     方案介绍


曙光存储服务器在百度的应用主要是搜索排序和查询!搜索排序,将网络爬虫抓回的网页按照关键字的匹配程度进行排序,生成索引,建立相关数据库;查询应用根据用户的请求,将对应内容进行呈现。系统的拓扑结构如下:

 

搜索排序要求硬件平台具有较高的处理能力,并且具有较大容量的本地存储空间,曙光公司切合用户的应用需求,采用曙光12盘位的存储服务器作为百度的搜索排序硬件平台,满足搜索排序应用对处理能力和存储能力的要求。
 

曙光存储服务器基于通用X86处理器平台,采用2U机架式设计,最大支持123.5寸热插拔硬盘仓位,可以提供高达24TB的本地高性能存储容量,有效提高搜索排序应用的相应速度。与传统的采用服务器和磁盘阵列的方案相比,曙光提供的存储服务器方案具有节省用户成本、占地面积小、管理简单、节能环保等诸多优势。

   项目总结

曙光与百度的合作始于2009年。依靠稳定的产品质量,及时的供货以及完善的售后服务,曙光在百度关键应用领域的占有率不断上升,同时也为日后业务的腾飞插上了翅膀。

未经允许不得转载:存储在线-存储专业媒体 » 曙光助力百度搜索查询应用存储系统