AI服务千行百业  “芯片代工厂”模式加速大模型落地

洪恒飞 科技日报记者 江耘

“深度学习作为人工智能的服务核心技术,具有很强的千行通用性,并具备标准化、百业自动化和模块化的芯片工业大生产特征,而大模型的代工兴起,使得人工智能应用的厂模深度和广度进一步拓展。”近日,式加速在2023年世界互联网大会乌镇峰会期间,模型百度首席技术官、落地深度学习技术及应用国家工程研究中心主任王海峰阐述大模型产业模式时称,服务人工智能已进入工业大生产阶段。千行

乌镇峰会期间,百业王海峰介绍大模型产业模式。芯片受访者供图

今年3月,代工百度发布新一代知识增强大语言模型文心一言。厂模目前文心一言的基础模型已迭代到文心大模型4.0,自8月31日面向全社会开放至今,用户规模达到7000万,场景4300个。王海峰介绍,文心大模型4.0基于更强平台、更优数据、更好算法训练,是规模更大、效果更好的知识增强大语言模型。其理解、生成、逻辑和记忆四项人工智能的基础能力,均有显著提升。

简析人工智能现有技术体系可知,深度学习框架和大模型处于承上启下的位置——下接芯片,可以和算力基础设施协同优化,让基础设施效率更高,应用则建立在深度学习框架和大语言模型之上。

机械技术,电力技术,信息技术……不难发现,驱动一次工业革命的核心科技,需要具备通用性,从而能真正影响千行百业。深度学习加大语言模型的通用性及工业大生产特征如何理解?

“人工智能具有多种典型能力,理解、生成、逻辑、记忆是其中的基础能力,这四项能力越强,越接近通用人工智能,而大语言模型具备了这四项能力,且越来越强,为通用人工智能带来了曙光。”王海峰解释说。

他进一步解释,标准化方面,框架和模型联合优化,多硬件统一适配,应用模式简洁高效,可大幅降低人工智能应用门槛;自动化方面,从训练、适配,到推理部署,提升人工智能研发全流程效率;模块化方面,丰富的产业级模型库,支撑人工智能在广泛场景的便捷应用。

谈及大模型产业化的现有挑战,王海峰认为,类似芯片代工厂模式,可以采用“集约化生产,平台化应用”的模式,即具有算法、算力和数据综合优势的企业将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务。

目前,这一产业化路径已在文心大模型产业实践中得到验证。记者在采访中了解到,百度与其合作伙伴共建了包括能源、金融、航天等10余个行业大模型,加速大模型产业化落地。