科大讯飞于5月6日,发布“讯飞星火认知大模型”。科大讯飞董事长刘庆峰、科大讯飞研究院院长刘聪在现场为大家用语音输入的方式真机实测大模型七大核心能力,并发布教育、办公、汽车、数字员工四大行业应用成果,全方位展示“讯飞星火认知大模型”的独到之处,发布会现场掌声不断。
大模型是当代人工智能的发展趋势,但是其过高的技术和资金门槛,意味着想要在该赛道冲出重围并非易事。纵观目前国内市场上的AI大模型,不难发现它们在数据、算力等方面依旧存在可提升空间。结合我国AI产业链与竞争格局现状,想在该领域拥有最终的发言权最终还是要看技术底蕴以及商业模式。
讯飞星火大模型具备七大核心能力,凸显国产大模型实力
通过对海量文本、代码和知识的学习,讯飞星火拥有跨领域的知识和语言理解能力,能够基于自然对话方式理解与执行任务。发布会现场,科大讯飞演示了星火认知大模型七大核心能力:一是多风格多任务长文本生成,即支持发言稿、邮件、营销方案等多类型、多语言风格文案写作;二是多层次跨语种语言理解,讯飞星火不仅支持作文、英文文案的快速纠错,还能准确区分同一单词语句在不同场景下的含义。三是泛领域开放式知识问答,医疗、科技、商业等领域的知识问答,星火都能轻松应对;四是情景式思维链逻辑推理,当提问“孔子在2008年的奥运会上说了什么?”,星火可以快速反应到“孔子不可能出现在2008年的奥运会上”;五是多题型可解析数学能力,都说大模型聪明与否看数学,在一些易混淆的数字问题上,如“某个公司的股票昨天涨了10%,今天又跌了10%,请问到底是涨了还是跌了”,星火也能轻松应对。六是多功能多语言代码能力,目前星火的代码生成能力主要针对工业互联网、企业内部的应用。当问到“用代码找出1到100之内的所有质数”,星火输出了Python代码实现过程和最终结果。七是多模态输入和表达能力,星火能直接将图片中的英文翻译成中文,同时,还支持用语音、虚拟人合成输出音频和视频。
多维度能力通力协作,实现技术快速突破
讯飞在认知大模型上能实现快速突破,主要得益于其在核心算法、算力、数据、人才的全方位投入和搭建。
20多年专注人工智能领域,让讯飞的多项核心技术均处于国际领先水平,2022年讯飞在认知智能技术领域累计获得13项世界冠军,在算法方面持续注入创新理念是支持讯飞在人工智能领域一路向前的秘诀;
算力方面,讯飞拥有业界一流的数据中心,目前已建成4城7中心深度学习计算平台,为大模型训练平台建设奠定了良好的基础;
数据方面,讯飞在多年认知智能系统研发推广中积累了超过50TB的行业语料和每天超10亿人次用户交互的活跃应用,为训练实现达到人类专家水平的行业认知大模型提供了海量行业文本语料和用户反馈数据。
人才方面,作为一个高度追求技术创新的企业,讯飞一向重视技术科研人才的挖掘和核心技术团队的搭建。讯飞研究院拥有200多人的核心研究人员,其中不乏《麻省理工科技评论》“35 岁以下科技创新 35 人”榜单中顶尖的年轻科学家,及众多国内外顶尖大学的人才。
聚焦人工智能领域20余年的科大讯飞在核心算法和技术创新上具备显著优势,此前推出的翻译机、办公本、学习机等产品均显示出讯飞在AI领域的全能性。凭借过往的积累,讯飞星火认知大模型定能成为提高工作和学习效率、降低生产成本、提高社会生产效率的优秀助手。