C114讯 9月19日午间消息(蒋均牧)面对一窝蜂堆算力、言必大模型的企业人工智能发展现状,华为轮值董事长徐直军在华为全联接大会2024上旗帜鲜明地指出,不是每个企业都需要建设大规模AI算力、都要训练自己的基础大模型,也不是所有的应用都要追求大模型。
首先,大规模AI算力建设存在着机房改造难、性能发挥难、运营维护难等难点。大规模AI算力集群堆供电、散热等数据中心机房环境要求高、改造难度大,同时随着AI算力需求的持续增加和AI服务器的升级换代,机房将面临持续改造;AI硬件迭代速度快,平均一到两年就有新的硬件产品推出,受限于诶个代际的算力规模,企业需要多个代际产品混合使用来训练一个大模型,资源调度复杂,带来性能木桶短板问题,新一代产品性能难以充分发挥;AI技术还处于成长期,技术变化快,多代际产品共存,对技能要求高,导致运营维护困难。
其次,基础大模型训练面临数据准备难、模型训练难、人才获取难等问题。基础大模型预训练数据量进入10万亿tokens量级,这对于企业来说,不仅意味着高成本,同时是否能获取到足够的数据量也是挑战;基础大模型参数量在持续增大,模型迭代和优化难度大,通常需要数月到数年时间完成模型迭代训练,影像AI尽快赋能核心业务;基础大模型涉及的相关技术每天都在更新,具备实战经验的技术专家少,对于企业来说,建立足够的技术人才资源也是挑战。
此外,从盘古大模型的行业实践来看,企业应根据不同业务场景需求匹配不同规格的模型,通过多模型组合来解决问题、创造价值。十亿参数模型面向科学计算、科研决策等业务场景以及端侧场景,例如降雨预测、药物分子优化、手机端通话助手;百亿参数模型面向NLP、CV、多模态等特定领域任务,例如知识问答、代码生成、金融坐席助手;千亿参数模型面向NLP、多模态的复杂任务以及作为中枢调度,例如信贷评估、智能投顾、多模型调度。
徐直军指出,对于很多企业来说,云服务是更为合理的、可持续的选择。华为云面向AI全栈升级,赋能千行百业智能化,让每个企业都能按需高效地训练模型和应用模型推理。华为通过持续打造昇腾云服务,让AI算力触手可及;通过不断升级ModelArts Studio模型即服务,让企业不必从零开始训练基础大模型;通过盘古大模型5.0和百模千态社区,让企业能够根据业务场景选择最适合的模型。此外,华为云还提供从理念、机制、技术到知识产权的体系化安全能力,全面保障大模型训练、推理安全。