根据Gartner2023人工智能技术成熟度曲线,目前大模型技术达到“期望膨胀期”的巅峰,市场渗透率约1%-5%,预计2-5年内将稳步发展至成熟期。当前处于产品化探索的窗口期,国内外大模型研发企业纷纷开启产品化进程。
大模型发展进入“期望膨胀期”,开启产品化探索
国外来看,美国大模型发展起步早,目前已形成OpenAI及谷歌领先、Meta及Amazon等其他科技大厂跟随、初创公司提供垂类特色服务的竞争格局。自2018年起,谷歌、OpenAI等科技公司开始推出自研大模型,2021年进入高速发展期,截至2023年7月底,国外大模型发布数量累计达138个。2022年11月,OpenAI基于大模型发布的ChatGPT开启对话式产品先河,此后通过战略合作陆续嵌入赋能微软的Bing搜索、Office办公产品,同时对外开放API接口并以plugin插件接入生态应用。谷歌亦推出对话机器人Bard及PaLM2,并将大模型接入谷歌的协作与生产力工具Workspace以及利用大模型赋能Spotify、沃尔玛、UberEats等外部应用。
国内来看,中国紧跟国际步伐,目前已形成互联网巨头通用模型领跑、AI厂商、创业公司及科研院所百花齐放的格局。2023年国内大模型开始爆发式增长,截至2023年7月底,国内已经有130个大模型产品亮相或宣布。2023年3月百度文心一言首发,拉开国产大模型的产品化的序幕,5月份开始加大AI原生应用投入,持续探索大模型应用之路。2023年4月阿里也相继发布通义千问产品并将大模型能力全面接入内部应用。截止2023年8月底,国内已有11家AI对话式产品获得版号,标志着国内大模型由内测转入向全部公众开放服务。
当前拥有大模型的头部企业的产品应用方向,主要包括打造原生AI入口产品、内部产品赋能和垂直行业赋能三大方向。一是科研院所及创业公司,基于自身技术基因、产投研一体化优势,致力于打造原生AI对话型入口产品,如清华大学联合智谱公司开发ChatGLM2大模型,并基于此模型于8月正式上线生成式AI对话产品智谱清言,利用C端用户数据反哺模型训练。创业公司百川智能在成立4个月内推出3款大模型,完成开源+闭源模型布局;二是华为等拥有行业解决方案的经验和积累的大型科技公司,提出“L0基础大模型-L1行业大模型-L2细分场景大模型”的发展路径,发布盘古大模型,重点为政务、金融、制造、矿山等垂直行业应用赋能;三是腾讯、百度、阿里等互联网大厂,在AI领域积累深厚,自有业务场景丰富,多采取原生AI入口产品+内部应用赋能+垂直行业应用全面布局战略。如百度基于文心大模型推出文心一言对话产品作为AI入口,同时将大模型能力应用于百度搜索、信息流、智能驾驶、百度地图、小度智能屏,全面赋能内部应用,另外,构建千帆大模型平台,赋能垂直行业伙伴,覆盖金融、制造、能源、政务、交通等行业的400多个场景。
大模型产品化的应用现状及趋势
(一)交互形态由文本向多模态融合演进,提升人机交互的自由度和丰富性
9月,OpenAI重磅发布ChatGPT更新版本,增加了语音合成、识别以及图像识别能力,语音合成方面OpenAI还与专业配音演员合作,提供了5种不同的声音。此外,谷歌Bard和微软Bing也在积极部署多模态功能,谷歌通过与Google Lens 集成为其 Google Bard 聊天机器人添加图像输入功能,微软的Bing Chat也将在其提示输入中接受图像信息。科技巨头积极推动多模态交互,提升人机交互的自由度和使用效率。
(二)交互界面在通用页面上叠加细分场景,提升自然语言交互的可理解性和准确性
在早期的大模型产品中,主要采用开放闲聊的UI界面,用户通过自然语言交互来完成任务。随着用户对输出结果的要求不断提高,国内大模型产品开始在界面形态上叠加细分场景,例如文心一言的“一言百宝箱”、通义千问的“百宝袋”以及讯飞星火的“助手列表”等。这些大模型产品以生活助手、办公助理、趣味创意、学习帮手等细分场景为出发点,为用户提供更聚焦、更精准的服务界面,提升用户输入的便捷性和输出结果的准确性。
(三)从参数至上转向个人模型微调,探索个性化大模型产品服务
随着大模型参数规模的膨胀,训练成本、算力成本及运营成本也随之剧增,GPT-4的训练成本高达1亿美金,企业的现金流不断承压,同时参数规模并非衡量模型质量的正确方式,参数越大,模型在部分领域的幻觉问题愈严重。万亿级以上参数规模的模型,其意义更多在于探索智能化程度的上限,实用性低。在应用层,百亿级大模型适用性更强。另外面对日益多元化的应用场景,大模型需求正呈现出多样化、个性化的特点,业界关注焦点从参数至上转向应用为王,在通用大模型的基础上,在产品层面开放模型微调。例如OpenAI开放大模型微调功能,上传自己数据就可定制GPT-3.5Turbo,人人可打造专属ChatGPT。当前可实现开发者自行监督微调,OpenAI透露,未来将推出微调UI,实现面向大众用户的产品化功能。
(四)从通用理解能力向决策处理拓展,探索大模型自动化执行产品服务
大模型的使用界面基本为人机问答的形态,人类在文本框内输入问题,大语言模型做出回答。AI Agent则更进一步,不仅可以告诉人类如何做,更可以在现实中帮人做,是一个能自主理解、规划、执行复杂任务的系统。只需给定目标就能够自主执行、独立运作的AI Agent被认为是“变革社会的生产力工具”。目前已涌现了Camel、AutoGPT、BabyAGI、AgentGPT等AI Agent项目,并有一大批开源社区开发者和创业者,利用这些开源项目打造一些实用工具。AI Agent的成熟发展未来尚需突破持续与环境交互的难题,同时有赖于大模型规划、推理、环境动态适应能力的进一步提升。
(五)大模型价值赋能从提升单点内容创作效率转向重塑组织业务的关键流程
“妙鸭相机”等AIGC产品火爆出圈仅仅两周左右后便快速式微最终归于平静。单纯利用大模型的生成能力实现图文内容快速创作,无法长期留存客户,大模型的价值也无法得以充分发挥。业界开始探索将大模型的能力深层嵌入到与用户日常息息相关的生活、工作流程,引发持续性的深刻变革,推动组织、社会生产效率提升。WPS、钉钉等在开始探索将业务应用和大模型的整合,其中WPS AI 已将大模型能力嵌入四大组件,即表格、文字、演示和PDF,大模型能力与现有工作流深度融合,繁琐、流程化的工作由AI替代完成,助力工作效率提升。
(六)大模型与行业数据结合从生活娱乐向金融、医疗、教育等领域加速渗透
大模型的应用场景从容错率较高、数据开放程度较高的行业开始逐步向高风险、低容错率、数据私密性高的领域演进。高质量的业务数据已成为稀缺资源,只有经过垂直领域知识库数据的调优,才能实现大模型的高价值、高可靠性输出。文心一言、通义千问、星火、百川等中国一批通用大模型正在快速迭代,将垂直行业数据与大模型深度融合,构建数据飞轮,形成先发优势和竞争壁垒。根据钛媒体数据,从全球来看,目前大模型在金融行业的渗透率最高,已达到78%。美国彭博社已推出金融行业大模型BloombergGPT,该模型将GPT大模型与金融数据库进行深度融合,可以提供更专业的金融数据提取、分析和计算服务。国内农行已率先推出ChatABC,并不断迭代升级,工行、交行、招行、平安银行、兴业银行等多家银行已披露其在大模型领域的探索及应用。对于金融、医疗等强监管、对精准性、可控性要求较高的行业,大模型产品的落地应用仍然还有很长的路要走。