(1)基础服务技术
百度每日承载数亿次点击访问,这需要庞大的支持检索及索引存储的运算集群,而运算集群中,服务器上的存储技术是至关重要的,为此百度研发了闪存(Flash Memory)技术用以代替硬盘。与当前广泛采用的普通硬盘存储相比,百度配备的基于闪存的存储卡,可使得单台存储设备的内部读写性能提升100倍,响应速度提升3倍,整机性能提升1倍,而能耗大大低于普通的硬盘存储。此外,由于闪存内部不存在机械设计,传统硬盘所惧怕的震动、尘埃侵入、高能耗等问题也迎刃而解。闪存(Flash Memory)技术的实施极大地提高了百度的服务能力和检索速度,同时也降低了能耗,网民和百度都能从中受益。
(2)搜索用户服务技术
1)超链分析技术
超链分析技术是新一代搜索引擎的关键技术,已为世界各大搜索引擎普遍采用,百度总裁李彦宏就是超链分析专利的唯一持有人。超链分析就是通过分析链接网站的多少来评价被链接的网站质量,这保证了用户在百度搜索时,越受用户欢迎的内容排名越靠前。
2)中文分词技术
查询处理与分词是中文搜索引擎必不可少的工作,而百度在“中文分词”方面具有其他搜索引擎所不具有的关键技术和优势。百度有一个很庞大的词库,其中包含了很多的人名、地名、公司名等,再加上正向最大匹配、反向最大匹配、双向最大匹配、最短路径方法等技术,能很好地满足用户的搜索要求。
3)P4P技术
百度使用的P4P拍卖系统使客户能够对关键字搜索结果中的优先展示位置进行出价,并且能够在百度及其联盟站点自动传递相关的、定位的促销链接。百度的智能排名系统会考虑一个关键词的质量因素以及对关键词的出价因素。关键词质量因素取决于关键词的相关性,关键词相关性的确定基于过去的搜索和点击结果分析,到客户网站的链接根据复杂的排名指标来排名。
4)框计算技术
百度框计算技术的实现过程如下:首先,用户的任意一个需求被提交到“框”里;然后,“框计算”经过一系列复杂的需求分析,包括语义分析、行为分析、智能人机交互和海量计算技术,将用户的需求分发给“框计算”后台单个或多个对应的数据或应用所响应;第三,“框计算”背后的资源平台是开放的,框计算平台提供了大量即插即用的接口,各种数据和应用可以主动与框计算平台对接,使自己有机会来响应框收集到的需求;最后,用户“即搜即得、即搜即用”地获得精准、可靠、稳定的信息或应用需求结果。在整个实现过程中,有两个方面的技术是很重要的,一个是需求分析技术,包括语义分析、行为分析、智能人机交互和海量计算技术,百度通过这些技术获得准确的用户需求;一个是分发技术,百度通过分发技术将用户的需求匹配到最接近用户需求的数据或应用,这些数据或应用会被直接展示在搜索结果页面供用户使用。
(3)百度智能云
1)平台架构
百度智能云新业务架构分为三层:第一是底层百度大脑,包括基础层、感知层、认知层和安全,是百度核心技术引擎;第二是中间平台,包括通用的基础云平台、AI中台、知识中台,以及针对场景的平台和其他关键组件;第三是在基础层和平台的支持下,上层的智能应用和解决方案将为各行各业赋能。在此基础上,百度智能云打造了一体化的安全体系,全面覆盖从AI模型安全到行业生态安全的方方面面,为产业智能化发展保驾护航。目前百度拥有涵盖北京、保定、苏州、南京、广州、阳泉、西安、武汉、香港等10多个地区的数据中心。
2)百度大脑
百度大脑是百度AI技术多年积累和业务实践的集大成者。百度大脑由基础层、感知层、认知层以及AI安全组成。基础层为大数据、飞浆深度学习平台以及算力的支撑;感知层包括语音、视觉以及AR、VR等能力;认知层主要包括自然语言处理和知识图谱,此外还有AI安全技术进行保驾护航。
3)AI芯片
百度自研昆仑系列通用AI芯片,为平台提供算力支撑。该芯片是中国第一款云端全功能AI(人工智能)芯片,也是业内设计算力最高的AI芯片。它的运算能力比最新基于FPGA的AI加速器,性能提升了近30倍。
4)飞浆深度学习平台
飞桨以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台,集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体。