Gartner:生成式AI发展需要新思路 中国数据要素战略加速实施

业界
TIME
2023-09-25 19:10
中关村在线
分享

  如今,几乎每一家企业、每一个人都与AI有着或多或少的联系,甚至很多企业患上了“AI焦虑症”,仿佛没有使用智能技术就会在数字化的浪潮被对手甩在身后,而恰恰也是在这个时候,是最容易产生发展泡沫的阶段。对此,Gartner有着独到的看法。相信很多业内人士对于Hype Cycle并不陌生,这一曲线描述了一项技术/概念从诞生到成熟的过程,对众多行业的发展周期进行了预测与判断,2023年,Gartner的中国分析师团队专门发布了面向中国市场的数据分析和人工智能成熟度曲线,从中可以看到一些前沿技术的最新进展,以及一些过往概念的幻灭。

  在Gartner 2023年中国数据分析和人工智能技术成熟度曲线中,揭示了与中国数据、分析和人工智能相关的四个基本主题:业务成果优先的中国数据战略,区域数据与分析和人工智能生态系统,数据中台的崩塌,以及人工智能成为新的国力象征。该曲线中,即将进入期望膨胀期的技术数量最多。毫无疑问,生成式AI是2023年最火的话题之一,由此也延伸出一些新的概念,例如“智能体”,包括如何把数字世界和物理世界相结合,构建一套自反馈的机制,形成自动化的系统,打造AutoGPT和AGI,这也是OpenAI等企业的目标。但是智能体并没有在中国的报告中体现,这个技术落地为时尚早。

  当然,考虑到中国和海外市场在技术应用、行业需求、客户习惯等方面的差异,在成熟度曲线中的体现也有所不同。Gartner高级研究总监张桐表示:“创新往往被吹捧为传统瓶颈问题的解决方案,有望解决中国CIO共同担忧的问题,如硬件资源短缺、可扩展性、可持续运营、安全风险缓解、技术自主可控和AI模型的多域适用性问题,从而带来清晰的业务价值。然而,终端用户更重视有形的影响,而不是抽象的战略概念。”

  谈到生成式AI,就不得不提各类大模型的快速涌现,甚至引发了“百模大战”。所谓大模型,是在大范围的数据集上以自监督方式训练的大参数模型,其中大多数都是基于Transformer架构或扩散型深度神经网络架构,并且在不久的将来可能会成为多模态。目前,大模型已成为自然语言处理的首选架构,并已应用于计算机视觉、音视频处理、软件工程、化学、金融和法律领域,由大模型衍生出的一个热门子概念就是基于文本训练的大语言模型。

  从大模型的发展现状来看,数据、算力、算法是绕不开的因素。“在这三者(数据、算力、算法)之中,比较大的变数就是Transformer算法会不会变化,是否会有新的算法降低能耗,还有就是芯片的架构设计能否进一步优化,比如引入一些神经网络的特性,以类人脑的方式去降低功耗。”张桐说。

  根据Gartner的说法,所有的生成式AI都是基于Foundational Model所构建,后者还包括GPT(文本)、Stable Diffusion(绘图)、LLM等类别。以GPT为例,利用Transformer架构,通过云基础设施(GPU等)结合数据资源训练出来的模型就是基础模型,不过这种基础模型的能力只有少数几家企业具备,更多的企业则是在基础模型之上进行一些精调训练。对于一些企业来说,,只需要做好SFT(模型微调),相当于选择了一个架构和平台之后,在上面开发各类应用就可以了。

  张桐认为,文心一言、星火、盘古大模型、清华的GLM等模型都是值得关注的,除此之外,考虑到合规性和数据安全,像金融等行业的客户往往会选择本地部署,不过本地部署的成本又是不少企业担忧的问题。关于AI的下一步演进,知识图谱与大语言模型的结合或许会给人们提供相对高质量的结果。

  组装式数据和分析是AI实践的另一个体现,其利用基于容器或业务微服务的架构和数据编织理念,将现有资产组装为灵活、模块化和用户友好的数据分析和AI能力。这项技术可在低代码和无代码能供的支持下,综合运用一系列技术将数据管理和分析应用转变为数据分析和AI组件或其他应用模块,并且支持自适应和智能决策。这种组合式的智能化能力可以由企业按需配置,快速部署,满足个性化的要求,适用于当前需要提高敏捷性的客户,加快洞察产出速度。同时,这种方式也有助于企业在各项措施中融合多个洞察与参考信息,避免割裂式开发。企业机构可通过组装或重组D&A能力进一步提高交付的灵活性,应对不同使用场景。

  相关文件指出,数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各环节,深刻改变着生产方式、生活方式和社会治理方式。数据要素,已经成为重要的战略资源,由此也引发了围绕数据的一系列理念与实践。数据资产管理是指管理、处理和利用对业务运营来说具有宝贵资产价值的数据的过程。数据资产管理适用于多种数据形态——例如,系统中的图像、视频、文件、资料和交易数据,并涵盖从数据获取到销毁的整个数据生命周期,目的是以管理资产的方式管理数据,并从中创造价值。张桐谈到,在国家的大力支持下,数据要素将发挥更大的价值,数据入表会加速实现。

  数据编织是一种设计框架,用于获得灵活而且可复用的数据管道、服务和语义,涉及数据集成、主动元数据、知识图谱、数据剖析、机器学习和数据分类。从概念上来说,数据编织早已被提出,不过其没有被大面积应用的原因是必要性有些高估,由于数据编织是基于元数据衍生而来,但很多企业对元数据的理解并不深入,导致在使用数据编织难以实现较好的效果,甚至增加了复杂性。

  事实上,这种认知偏差也使得不少理念逐渐淡出人们的视野。以数据中台为例,这是一种组织战略和技术的实践,创建数据中台可以被是为企业构建可组装和可复用地数据和分析能力地一种方式,最早被大范围的传播始于阿里巴巴的应用。根据Gartner的观察,很多中国企业之所以采用数据中台实践,是为了减少其数据和分析架构的技术冗余,打通不同系统的数据孤岛,并推动可复用的数据和分析能力。但数据中台在许多情况下未能兑现其组装式敏捷D&A能力的承诺,因此在市场中的地位被削弱,很多企业机构和供应商都不愿意在企业内部采用这一概念,或者干脆将其从宣传中移除。

THE END
免责声明:本文系转载,版权归原作者所有;刊载之目的为传播更多信息,如内容不适请及时通知我们。

相关热点

  在今日举办的华为秋季全场景新品发布会上,余承东宣布,华为智选车首款纯电轿跑智界S7将于11月底亮相上市。  该车拥有封闭式前脸,不同于很多电动车采用的眯眯眼大灯,...
汽车
  9月29日为中秋节,10月1日至10月3日为国庆节法定节假日,按300%算加班工资。9月30日,及10月4、5、6日是调休,加班且无补假的,按200%算休息日加班工资。  根据《工资支付...
互联网

相关推荐

1
3