1月5日,国家互联网信息办公室公开发布了第三批深度合成服务算法备案信息的公告,达闼旗下基础大模型算法和RobotGPT多模态具身大模型算法正式通过了备案,其中,RobotGPT多模态具身大模型是国内唯一获得备案的机器人具身智能大模型。这不仅标志着达闼在人工智能领域研究和开发上取得阶段性成果,更是对公司未来拓展应用场景、提升竞争力的有力支撑。
达闼基础大模型算法:引领自然语言处理技术创新
达闼基础大模型算法是公司自主研发的基础大模型,主攻自然语言理解、自然语言生成和自然语言处理等领域,为对话问答类企业端客户提供高效服务。通过结合上下文信息,该算法能够根据用户提出的问题生成相应的文本回答,为用户提供全新的自然语言交互体验。
RobotGPT多模态具身大模型算法:国内唯一备案的具身智能大模型
具身智能是能理解、推理、并与物理世界互动的智能系统,是人工智能的下一个浪潮。具身智能中的智能体要以第一人称身份融入周边环境,拥有感知、认知、决策和行动的全面能力,像人类一样自主处理任务。而大模型的“通用认知性”可使具身智能机器人具备强大的特征学习和泛化能力,通过强大的云端计算支持,应对复杂任务及决策,进一步实现对任务场景的拆解和思维链能力,因此,大模型是具身智能机器人的不可或缺之选。这就是RobotGPT多模态具身大模型所做的工作。
继基础大模型后,达闼于去年7月推出了首个机器人领域人工智能大模型——RobotGPT多模态具身大模型,它是达闼专为实现机器人在不同复杂场景中的多模态行为而打造的具有高级交互生成能力的具身智能大模型,不仅整合了强大的语言生成和处理功能,还融入了情感分析、视觉语言导航、视觉语言操作、表情动作生成、自主行为决策等多模态输入输出功能。
这种集成化设计使得RobotGPT不只是一个简单地回答问题或者进行文本创作的AI系统;它实际上已经跨越到让机器人可以在真实世界中进行任务分解、自主导航、抓取物体等操作。
RobotGPT利用深度强化学习技术来处理并整合来自各种传感器(如摄像头、麦克风)收集到的多种类型信息,并结合预训练大模型所提供的广泛知识库来做出决策。它的推理能力不仅仅是基于预训练的知识,还能够利用历史经验进行适应性学习。这样一来,它就可以根据用户给出的指令或者遇到新情境时快速调整行为策略。
该技术背后还涵盖着几个关键模型:
大语言模型:负责处理自然语言输入输出,支持开放式问答和内容创作。
开放域检测视觉大模型:使机器人可以识别并理解其所处环境中对象及场景。
机器人导航与抓取大模型:赋予机器人空间移动和精确操控物体的能力。
基于深度强化学习专家小模型:优化特定任务执行过程中遇到挑战时所需采取行动。
达闼推出的RobotGPT标志着AI从纯粹数据驱动向真正意义上具备“身体”(具身智能)的转变——即从桌面端软件走向移动性与交互性更强且更加接近于生命体验方式运作方式转变。这一技术产品的推出,不仅为企业端客户提供了更加智能化的服务,也为机器人技术的创新与应用开辟了新的道路。
深度应用多领域,助推千行百业数字化、智能化发展
RobotGPT多模态具身大模型的应用领域十分广泛,已成功落地能源电力、医疗健康、金融保险、交通枢纽等十多个重点行业,并支持百余个客户场景的应用。在电力领域,它能够提供知识问答、多轮对话等智能服务;在医疗健康领域,它助力自主服务和病理推断;在金融保险行业中,它通过分析语音和行为来精准评估风险;而在交通枢纽如机场和地铁中,该模型训练调优生成机场、地铁服务类大模型,在满足机场、地铁等知识问答的同时,赋能各种类型的服务和功能机器人,完成复合型和个性化业务,提高服务运营质量。
去年9月,凭借强大的场景落地能力,“RobotGPT多模态大模型赋能千行百业”案例也获得了由国家工业信息安全发展研究中心发起的《“智赋百业”2023年人工智能融合发展与安全应用典型案例》【领航型】奖项,受到了行业的关注和认可。
此次备案的通过,不仅标志着达闼RobotGPT多模态具身大模型在技术上的成熟,也意味着达闼的大模型技术受到国家政策的支持和鼓励。这将为达闼在云端机器人领域的发展提供更大的助力,加速机器人在各领域的应用落地,进一步推动行业的快速发展。
RobotGPT的使命是“赋能千行百业、引领具身智能”。未来,达闼将依托“云端机器人-国家新一代人工智能开放创新平台”,进一步推动RobotGPT大模型的创新和应用,助力企业级客户获得AI能力和实现更长线的增长,促进人工智能产业的健康发展。