面向垂直行业的行业大模型发展及应用

数码
TIME
2025-03-25 11:18
中移智库
分享

垂直行业大模型帮助传统产业实现数字化转型,将有望破解各垂直领域的复杂业务难题,引领新一轮产业升级。然而,行业大模型发展面临数据处理成本高、模型执行能力弱、数字化人才供给不足等难题,建议:一是提升垂直行业数据采集、处理和流转能力;二是打造内生行业大模型服务,攻克实际生产难题;三是完善人才培养机制,重塑垂直行业工作模式。

垂直行业大模型现状

我国已进入中度老龄化社会,人口老龄化造成的劳动人口数量下降,垂直行业由传统的劳动密集型产业转变为技术密集型产业。行业大模型通过整合行业数据、算力和人才资源,赋能垂直领域,促进工业等垂直行业数智化产业升级。

随着党的二十届三中全会提出“加快构建促进数字经济发展体制机制,完善促进数字产业化和产业数字化政策体系”等重要任务,国内企业迅速跟进,积极推进大模型研发。截至2025年1月,根据国家网信办《生成式人工智能服务已备案和已登记信息》,全国已有302个大模型产品通过备案,最新一批行业大模型占比超50%。2024年11月,沙利文咨询公司发布《2024年中国行业大模型市场报告》称,2023年中国行业大模型市场规模达105亿元,预计2028年行业大模型市场规模有望达到624 亿元。

面临的挑战与风险

数据处理成本高,知识凝练难

行业大模型生长于通用大模型之上,紧密贴合垂直领域的任务需求,严谨精准地作出决策回应。高度凝练的知识是大模型的建立基础。目前,根据浪潮信息与国际数据公司(IDC)联合出版的《2025中国人工智能计算力发展评估报告》,70%的组织开始投入生成式人工智能的研究,17%的组织将其引入生产环节。在金融、医疗、教育等多个知识密集型行业,大模型已经实现了初步应用,并产生了明显的经济和社会效益。而对于工业、电信业等重生产的数据密集型行业,高敏感的海量数字型数据和多模态数据导致生产源端采集不全、数据流转压力大、数据标注效率低,这些行业数据体量虽大但难以形成知识有效指导行业大模型的学习。

2024年底至2025年初,我国密集发布数据领域政策措施,指导企业数据资源开发。为实现数据高效流通,2024年12月,《国家数据基础设施建设指引》对数据供给和行业数据应用等方向提出建设要求,指引建立以行业、区域数据基础设施为主体,以企业数据基础设施为重要组成的国家数据基础设施。在数据流通期间,海量的行业数据如何产生可复用价值是一项关键挑战。

模型执行能力弱,与高吞吐业务系统难协同

通用大模型的商业模式在探索初期困难重重,微软的GitHub Copilot产品接入GPT系列模型,在发布之初,平均每月在每个用户上的亏损超过20美元,每个重度用户亏损高达80美元。垂直行业大模型仍处于探索阶段,为快速落地,多与GitHub Copilot一样采用服务外挂形式,大模型普遍存在的推理时延高、可控性差,使其难以形成与原有业务系统深度融合的原生大模型操作系统。大模型在生成决策后,因与业务系统相互脱节,无法形成从决策到业务执行的完整闭环,这极大束缚了垂直行业大模型的价值释放。成本与收益的不均衡,阻碍行业大模型的深入应用与拓展。

人才供给不足,应用型人才缺乏

随着垂直行业产业升级不断推进,行业人力结构正经历重塑,劳动力面临着紧迫的技能提升需求。在此过程中,既精通生成式AI研发,又熟悉业务研发的跨领域应用型人才尤为稀缺,成为垂直行业数智化发展的制约因素之一。美国Indeed招聘数据显示,每40个正在招聘的软件开发人员职位中,就有1个职位需要与生成式AI相关的技能,该比例自2023年初以来已增长100多倍。《纽约时报》刊文称,AI研究人员正成为“地缘政治意义上全球最重要的群体之一”。当前,我国AI人才缺口高达 500 万人,进而引发企业间人才恶性争夺的潜在风险。

相关政策和建议

(一)提升垂直行业数据采集、处理和流转能力

一是拓展垂直行业数据来源的广度与深度。积极收集行业专家经验,扩充数据采集方法,运用数据因果推断等技术高效准确地提炼行业知识,对垂直行业数据链路,从初始的数据采集,到深度的知识凝练,进行全方位系统性优化,确保数据来源既丰富多元又具高价值性。二是构建更为完善的数据处理机制。围绕数据可复用和互操作价值,打造高效的多模态数据标注方法,统一行业标注标准,在海量源数据中挖掘、留存高质量数据,以此推动我国垂直行业数据要素价值的充分释放与高效利用。三是降低数据迁移成本。通过融合隐私计算、无损压缩、6G通信等关键技术,搭建可信、高速、稳定的传输通道,支撑数据高效流转和利用。同时,加速制定与国家数据系统对接的规划方案,推动数据在更大范围内的互联互通与协同共享。

(二) 打造内生行业大模型服务,攻克实际生产难题

一是聚焦垂直行业特色的软硬件协同攻关。软件层面,着力降低大模型推理时延,设计行业大模型与可执行智能体的工作链路编排;硬件领域,则致力于为垂直行业提升算力供给,夯实发展基础,共同打造原生行业大模型系统。二是整合企业资源,聚力核心场景。积极倡导AI基础能力复用,避免重复性研发工作,实现资源的高效配置与利用。三是激励企业创新,探索核心业务场景的全新模式。全力推动人机交互范式革新,加速构建系统自智的端到端全自动生产通路,打造具有国际竞争力的高端生产体系,助力我国数字化产业实现跨越式升级。

(三)完善人才培养机制,重塑垂直行业工作模式

一是推动垂直行业的岗位升级,培训现有人员,实施包容的企业劳动力转型,培养跨领域的复合型人才。二是引入低代码或无代码的AI开发平台,降低非AI专业但熟悉业务流程的人员的AI应用研发门槛,通过简单拖拽、配置操作,参与行业大模型部分开发工作,发挥其在专业领域的价值,提高整体研发效率。三是建立行业大模型研究的众包平台,将一些数据标注、简单算法测试等基础性工作分解成小任务发布在平台上,吸引 AI 爱好者、兼职人员参与。

THE END
免责声明:本文系转载,版权归原作者所有;刊载之目的为传播更多信息,如内容不适请及时通知我们。

相关热点

  京东近期在香港市场采取了一系列重要举措,以进一步扩大其市场份额并提升消费者体验。以下是主要措施:  ‌“买贵就赔”服务‌:京东面向香港消费者推出了“买贵就赔...
电商
  科技日报北京3月24日电(记者刘垠)24日,财政部公布的《2024年中国财政政策执行情况报告》(以下简称《报告》)显示,2024年财政收入恢复性增长,比上年增长1.3%。各级财政部门...
业界
1
3