对话百度侯震宇:通用大模型什么都可以干,但不一定都能取得最佳成绩
出品 | 搜狐科技
编辑 | 梁昌均
云计算正在越发成为大厂竞逐的焦点,作为国内“四朵云”之一的百度智能云,在去年5月由沈抖接任负责人后,提出了“云智一体,深入产业”的战略,近日还推出了国内首个全栈自研的AI基础设施AI大底座,并全面升级25项产品和技术。
据介绍,AI大底座由AI IaaS层(百舸AI异构计算平台)、AI PaaS层(AI中台)两大部分组成。在AI IaaS层,整合百度自研的AI芯片昆仑芯,在AI计算、存储、加速、容器方面进行系统优化,提供高性价比的算力,承载海量数据的处理、超大模型的训练和推理。
在AI PaaS层,整合百度飞桨深度学习框架和文心大模型,打通百度的样本中心、模型中心、AI 开发平台、AI服务运行平台,实现从数据存储到模型训练、生产、部署、测试的全链路、批量化生产,面向企业模型开发的全生命周期提供完整解决方案。
百度副总裁侯震宇在接受搜狐科技等媒体采访时表示,百度选择在此时发布AI大底座,可以说是技术积累和行业需求共同催生的结果,将过去相对独立发展的产品线一体化,从而能够实现纵向整合优化的效果。
他表示,百度在过去十几年一直在AI和云上有大量投入,国内目前没有任何一家企业像百度一样,在智能计算的核心领域拥有全栈自研的关键技术,芯片、框架、模型、应用全要素每一层都有非常领先的技术基础,包括从最底层AI芯片到自主可控的飞桨深度学习框架,尤其最近特别火的大模型,百度都具备领先优势。
百度副总裁侯震宇
数据显示,百度智能云2021年总营收151亿元,同比增长64%,三年间收入提升2.4倍。去年第三季度,百度智能云营收45亿元,同比增长24%,增速高于行业平均水平。据IDC报告,在AI公有云市场,百度智能云已连续6次获得第一名。
随着产业数字化和智能化的推进,AI原生时代正在加速到来,这对云计算的基础设施也提出了新要求。侯震宇认为,计算负载从经典意义上的CPU同构计算,向异构计算、向重AI契合AI的体系结构上做迁移,是未来十年来能够看得到的最大趋势。
他进一步提到,当计算负载从通用CPU往更高密度、并行度更高的GPU异构算力上做迁移时,整个硬件经典意义上的体系结构会发生变化,相应的基础软件会有巨大的变化,整个计算环境都会产生颠覆性变化,这就需要整个全栈融合的大智算基础设施来做优化加速。
“大模型对于AI发展来说,确实是影响深远的技术,它真正改变了AI应用开发的新范式。”侯震宇表示,AI大模型对于底层算力更高的要求也将推动整个体系结构向着更高、更快、更强的方向发展。
目前,百度推出了文心大模型,并在此基础上加入行业知识打造了11个行业大模型,覆盖金融、制造、电力、交通等领域,大模型也内嵌在百度AI大底座当中。
侯震宇对搜狐科技表示,行业大模型是大模型目前最好的落地方式,通用大模型什么都可以干,但不一定都能取得最佳成绩,纯粹的通用大模型解决不了应用场景里更高识别准确度的需求,但基于通用大模型之后的再训练过程可以达到。
比如此前火爆的预训练语言大模型ChatGPT几乎能够回答任何问题,但在具体生僻或专业的领域还是无法令人满意,甚至是某些常识性的知识它也会出错。
在侯震宇看来,大模型能够让AI开发、AI能力落地站在一个真正的“巨人”肩膀上,大幅降低AI开发和AI适配的成本,同时基于行业知识的小样本还会反馈回到大模型里面来,从而可以让整个大模型的能力变得更强。