中国发表的大模型超过100多种,但真正做基础大模型门槛比较高,通常是互联网的大企业,少有垂直行业的企业自建大模型。邬贺铨表示,基础大模型通常从通用语料训练生成,通识能力强,从聊天对话入手容易反馈迭代优化,但聊天难成刚需,落地行业应用将更显大模型的价值,但基础大模型缺乏行业专业知识,需要大模型提供方与垂直行业合作开发行业大模型。
邬贺铨介绍,基础大模型跟行业数据的结合有两种方式。
一种是中心化模式,就是企业把自己的数据送给基础大模型,基础大模型在原有的预训练基础上,结合行业、企业的数据再进行微调,然后结果可以反送到企业。这种方式企业可以减少企业的技术人才的要求,但是企业数据送到基础大模型提供方有数据泄露风险。
另一种是非中心化模式,企业的算法工程师,按照特定业务场景以专有数据对基础大模型进行微调,形成行业大模型。这种方式对企业本身的人才技术要求比较高,对大多数中小企业也不适用。
“对于很多中小企业来讲,大模型可望而不可及,如果把大模型变成一个模块插入到云上面,企业上云就可以接入到大模型,并且可以通过自身的数据进行进一步细化。”邬贺铨提出,MaaS(模型即服务)是针对中小企业而提出的服务模式,MaaS部署在中小企业本地设备上或公有云上,以小切口嵌入PaaS与SaaS间,并提供调用基础大模型的接口,可加入企业自身数据对模型精细化调整,从而将大模型能力嵌入到SaaS产品上,解决了传统SaaS面临的客户定制化需求和标准化产品规模化盈利之间的难题。
此外,大模型必须要跟大连接、大平台、大算力结合,但在公共大模型和私有大模型混合式的模式下,如何保障个人隐私数据安全、如何平衡数据安全和生产效率是一个非常重要的课题。
邬贺铨介绍,开放工具链,利用网络将多云协同起来,从网络云化到云网协同,再到算网融合,利用5G的能力可以让企业在公共的运营商的网上,搭建一个企业私有的、可管理的局域网,做到企业的敏感数据不离开企业。