星火语音大模型诞生的意义,不仅仅是成为更高效和智能的生产力,科大讯飞的判断是,语音交互,能加速万物互联时代的到来。
“听说今年尔滨特别火,作为南方小土豆还挺想去玩一下的。要不你用东北话介绍下有啥好玩的呗?”这是一段用语音输入的需求。
随即,手机中响起一口地道东北话,不仅制定了旅游攻略,还提醒春运机票紧俏,催促赶紧买票。
这位贴心的“东北朋友”,实则科大讯飞最新发布的大模型“讯飞星火V3.5”。人机交互界面从去年的自然语言交互,发展到如今的全语音交互,也标志着大模型将万物互联时代的语音交互推到了新的高度。
1月30日,在大模型应用落地元年,科大讯飞交了一份有厚度的开年答卷:
在算力层,与华为昇腾联合打造的国内首个纯国产算力平台“飞星一号”进行了首秀——基于其训练的开源模型“星火开源-13B”,也首次秀了肌肉;在模型层,讯飞星火V3.5底座能力升级,整体接近GPT-4。与此同时,国内首个语音大模型“星火语音大模型”也初次亮相。
三个月内,一个“升级”,三个“首秀”——即便对成立25年仍在不断创新的科大讯飞而言,亦是勇敢的挑战。
在2023年10月24日的全球1024开发节上,董事长刘庆峰就立下军令状:联合华为打造自主可控大模型算力底座“飞星一号”平台,在此基础上,讯飞星火大模型开启对标GPT-4的更大规模训练。
讯飞用近百日交出的答卷,刘庆峰如此形容:不仅达到预期,还带来惊喜。
基于全国产算力训练后,星火V3.5七大核心能力全面提升,在语言理解、数学能力超过了GPT-4 Turbo。
但恰恰只有走在技术变革浪尖的人才能充分明白,新的模型能力高度,注定会将AI应用场景拓展到前所未有的广度;对下游应用厂商而言,新的AI世界中也蕴含着新商机。
三个月的“讯飞式”磨炼,已为大模型产业,打开了一扇通往新世界的门。
大模型的智能涌现,已经给人类带来了无数关于新世界的想象:
基于内容理解能力,大模型能成为提效的打工神器,也能成为翻译、教师、科学家等各行业的专家,助力知识传播和普惠;基于全语音等多模态交互能力,AI能接入手机、PC、汽车、智能家居,推动万物互联,创造新商机的同时,为用户带来全新的产品体验。
当然,通往新世界,要求更出色的模型能力,而锤炼模型,归根到底需要更大规模的高性能算力。
众所周知,大模型是一场算力入场费高昂的游戏。此前OpenAI发布的研究报告就表明,在2012年至2018年的早期研发过程中,AI大模型所消耗的算力,每隔4个月就会翻倍。国外巨头尚且囿于算力短缺困局,长期依赖海外高性能芯片的国内厂商,一时更是难以找到国产替代。
“星火大模型的持续迭代升级基础是自主可控的算力平台,不会受制于人。”正如科大讯飞的判断所言,要让AI发展不掣肘于芯片的供应,则需要国内厂商自建算力命脉。而建立国产算力平台,也成为国内芯片厂商布局的方向。
但要让国产算力精准适配AI大模型训练的需求,仍需要一定的磨合期。要让国产算力在AI领域大规模商用,少不了大模型厂商的深度共建。更进一步,国产大模型想要追上甚至赶超GPT-4的能力,则需要更大规模的算力、以及创新训练技术的支持——前者提供燃料,后者则是提升训练效率的催化剂。
为了实现追赶GPT-4的目标,在去年全球1024开发节上,科大讯飞宣布与华为联合发布大模型算力底座“飞星一号”平台。
彼时的科大讯飞与华为昇腾,已经在算力搭建上做了不少生态共建和技术磨合。2023年7月,讯飞星火就与华为昇腾AI联合,让国产大模型架构在自主创新的软硬件基础之上,打造国产通用智能新底座。8月15日,科大讯飞与华为还共同发布用于构建专属大模型的软硬件一体化设备“星火一体机”,让底层算力、AI框架、训练算法、推理能力、应用成效等AI能力,对每家企业或机构都“开箱即用”。
在如今的国际局势下,种种迹象表明,海外芯片的阻力或将愈来愈大。只有国产的底层算力土壤能与美国一较高下,其中生长出的AI模型和应用才有更多较量的可能。
因此,“飞星一号”的出现,不仅对于科大讯飞,而是对AI全产业均有重大的意义。一方面,“飞星一号”不仅能满足讯飞自身大模型快速迭代、发展的需要。另一方面,也能为国内AI产业提供国产化的算力底座,将应用布局在国产算力之上。
国产算力的土壤上,能生长出怎样的大模型?1月30日,到了“飞星一号”交答卷的时刻。
讯飞星火认知大模型 V3.5,是基于“飞星一号”平台的国产算力原生模型,也承载了科大讯飞剑指GPT-4的野心。
大模型能力的全面提升,也极大提升了星火的应用落地的赋能深度和场景广度。
比如在教育领域,刘庆峰判断“教育是真正的全民刚需”,AGI作为能够改变世界生产生活方式的全新技术,可以推动人类进步。发布会上,科大讯飞推出了接入V3.5的星火智慧黑板。基于多模态理解与推荐、全自然交互、虚拟人辅学等功能,“爱因斯坦”能够成为孩子的教师,不同科目能够因材施教,枯燥的理论能够被结构为清晰易懂的可视化表达。
而在职场办公领域,自智能初步涌现以来,大模型也一直作为生产力工具,被给予提效的厚望。发布会上,接入讯飞星火V3.5的打工神器“讯飞智文”,用几分钟的时间,就生成了超20页的PPT。
当然,随着应用落地步伐的加快,模型能力的迭代方向,最终要根据厂商自身优势,找到满足市场需求、解决用户痛点的场景。
科大讯飞选择了与身俱来的强项:智能语音。
科大讯飞发布的国内首款语音大模型“星火语音大模型”。在对中文、英语、法语、俄语等37个主流语种的语音识别效果,星火语音大模型已经超过了OpenAI Whisper V3。具体到表现,星火语音大模型也实现了“像人一样说话”,首批40个语种拟人度超过83%。
占有中文语音技术市场70%以上的市场份额,科大讯飞在智能语音领域的技术和产品实力,有目共睹。2023年8月,科大讯飞跻身国内11家首批大模型备案获批的公司。通过将星火认知大模型的能力落地到智能办公本、AI学习机、翻译机、录音笔等产品中,讯飞AI硬件销售额在双十一期间同比增长了126%,多个产品蝉联京东&天猫双11品类销售额冠军。
本次语音大模型重点落地到科大讯飞的当家硬件产品讯飞翻译机中,新上线的多语种自动识别功能,支持对35种语言的自动识别和翻译。而新增的增强式翻译功能,则瞄准了中英双语服务场景,让跨语言交流更加丝滑。
另一个重要场景是汽车,当大模型上车,语音就是最为合适的人机交互方式。而接入熟练运用多种语言的语音大模型,亦将成为车企拓展海外商机的窗口。比如,连续几十年位居中国汽车出口量第一的奇瑞,能够顺利出海覆盖英语、俄罗斯语、西班牙语、阿拉伯语、葡萄牙语等数十个语种的国家,背后也都有科大讯飞提供的智能语音交互技术。
不仅仅是车的交互体验,刘庆峰在发布会上描绘的图景中,陪伴机器人、智能家居、穿戴式设备等产业也将随着语音大模型的赋能进一步被引爆。
“人类80%的信息输入依靠视觉,90%的信息输出依靠声音和语言。”科大讯飞成立之初,刘庆峰就做出了如此判断。当下,他回顾初心:“科大讯飞从创业之初的梦想和使命,就是要实现沟通无障碍。25年了,我们目标和梦想一天都没有变。”
星火语音大模型诞生的意义,不仅仅是成为更高效和智能的生产力,科大讯飞的判断是,语音交互,能加速万物互联时代的到来。
2023年以来,星火大模型的落地也在逐渐深入:
亚运会上,工作人员借助讯飞星火与中国移动开发的5G新通话助手,实现刚挂电话就生成待办事项;科大讯飞联合科普中国、少年儿童出版社首发科普大模型,将优秀科普资源惠及广大中小学生,及时回应孩子的每一次提问,课堂学生互动参与率从25%提升到77%,问题解答率从23%提升到95%;自去年5月讯飞星火正式发布起,有超过60万讯飞智能办公本、智能录音笔用户累计调用语篇规整、会议纪要、自动写稿等能力650万次。
当模型竞速的重点从拼技术到拼应用,首先要保证大模型的安全可控。
科大讯飞首先在模型层面,就形成了立体化的“内容安全”保障机制。而通过与华为昇腾联合打造自主可控的国产化算力平台“飞星一号”,科大讯飞继而实现了对算力安全和自主发展的保障。而随着智算平台进一步对社会面企业和机构开放服务,高性价比且自主可控的国产算力,也将成为支持大模型发展的资源储备和坚实后盾。
其次,模型能力,也永远是模型厂商的立身之本。
仅用时三个月的模型能力迭代答卷已经证明,科大讯飞的模型进化速度在业界处于领先地位。此前,新华社研究院中国企业发展研究中心在2023年11月发布的《人工智能大模型体验报告3.0》也显示,讯飞星火认知大模型在10家最新版本国产主流大模型产品中蝉联冠军,并获得基础能力指数、智商指数、工具提效指数三项评测指标第一。
此外,模型可持续的迭代,是模型厂商的活水源头,才能保持下游AI应用生态的繁荣。
2023年仅仅是大模型的发展元年,各家厂商的模型实例还远未到拉开差距的地步。做好应用落地,形成数据飞轮,实现模型能力的可持续迭代和进化,才能让大模型厂商夯实自身的实力壁垒。
可持续的进化,一方面仰赖繁荣的开发者生态。在讯飞开放平台之上,大模型总开发者数量已经超35万,其中企业开发者超22万,增长势头迅猛。“讯飞星火大模型的开发者数量,在中国是最高的,而且用户口碑非常好。”刘庆峰说道。
另一方面,积累打通模型和行业落地的“最后一公里”的经验,对收集用户反馈、形成数据飞轮也至关重要。为了加速企业大模型应用价值落地,讯飞星火V3.5将提供全栈自主可控的优化套件。基于全国产化算力打造的讯飞星火V3.5支持异构算力调度,可实现行业大模型训练提效90%,支持23个企业应用场景的敏捷优化。
2024,将是大模型的应用落地元年,也是国产大模型加速探顶AGI的关键一年。“通过这场发布会,我们展望一个充满希望、孕育着生长能量的春天。相信2024年一定可以实现星火燎原,通用人工智能不仅能够在中国各大领域深度而广泛应用,而且我们在源头技术创新、在大模型的底层能力上也会站上全新台阶。”刘庆峰说道。