8月31日凌晨,备受行业瞩目的首批大模型产品获批名单终于出炉。其中,百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等8个企业/机构的大模型位列第一批名单,可正式上线面向公众提供服务。值得一提的是,阿里通义千问、360智脑、讯飞星火等均不在首批获批名单中。
附8家AI大模型简介和链接:
1.百度(文心一言)
https://wenxin.baidu.com
文心一言是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动,回答问题,协助创作,高效便捷地帮助人们获取信息、知识和灵感。2023年3月16日,百度正式发布大语言模型、生成式AI产品“文心一言”。6月,百度文心大模型3.5版本已内测可用。8月31日,文心一言率先向全社会全面开放。
2.抖音(云雀大模型)
https://www.doubao.com
云雀大模型是字节跳动旗下抖音研发的一款大模型产品。2023年8 月,其开发的 AI 机器人 “豆包” 开始小范围邀请测试。用户可通过手机号、抖音或者 Apple ID 登录。“豆包” 提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息。8月31日,字节的云雀大模型成为首批上线的8家大模型之一。
3.智谱AI(GLM大模型)
https://chatglm.cn
智谱AI是由清华大学计算机系技术成果转化而来的公司,致力于打造新一代认知智能通用模型。公司合作研发了双语千亿级超大规模预训练模型GLM-130B,并构建了高精度通用知识图谱,形成数据与知识双轮驱动的认知引擎,基于此模型打造了ChatGLM(chatglm.cn)。8 月 31 日,智谱华章正式上线首款生成式 AI 助手 —— “智谱清言”,现已在各大应用商店上线。该助手基于智谱 AI 自主研发的中英双语对话模型 ChatGLM2,经过万亿字符的文本与代码预训练,并采用有监督微调技术,以通用对话的形式为用户提供智能化服务。“智谱清言” 作为用户的智能助手,可在工作、学习和日常生活中为用户解答各类问题,完成各种任务。目前,“智谱清言” 已具备 “通用问答、多轮对话、创意写作、代码生成以及虚拟对话” 等丰富能力,未来还将开放多模态等生成能力。
4.中科院(紫东太初大模型)
https://xihe.mindspore.cn
紫东太初,是中国科学院自动化研究所研发的跨模态通用人工智能平台。2021年7月9日,2021世界人工智能大会(WAIC)昇腾人工智能高峰论坛上,中国科学院自动化研究所所长徐波正式报告了跨模态通用人工智能平台。2023年6月16日,中国科学院自动化研究所发布紫东太初2.0。目前,“紫东太初” 将于 9 月 1 日面向公众开放服务。
5.百川智能(百川大模型)
https://www.baichuan-ai.com/
百川大模型是百川智能推出的大模型产品,其融合了意图理解、信息检索以及强化学习技术,结合有监督微调与人类意图对齐,在知识问答、文本创作领域表现突出。成立仅四个月,百川智能便相继发布了三款通用大语言模型。百川智能称,截至今日,Baichuan-7B/13B 两款开源模型在 Huggingface 下载量已突破三百万。
6.商汤(日日新大模型)
https://www.sensetime.com/
日日新大模型是商汤科技宣布推出的大模型体系,包括自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseAvatar)等。2023年4月,商汤科技董事长兼首席执行官徐立宣布推出“日日新SenseNova”大模型体系。8 月 31 日商汤大模型应用“商量 SenseChat” 宣布即日起全面向广大用户开放服务
7.MiniMax(ABAB大模型)
https://api.minimax.chat
ABAB大模型,是一款先进的通用大语言模型,具有强大的语言处理能力,能够理解和生成自然语言文本,由Minimax自研推出。据了解,MiniMax 由前商汤科技副总裁、通用智能技术负责人闫俊杰于 2021 年 12 月创立,号称 All in AGI。2023年3 月,MiniMax 推出面向企业用户的 API 开放平台,支持文本和语音模型的服务调用。同一时间,MiniMax 另一款生成式对话 AI“ Inspo” 开启内测,具体能力包括写作、获取信息、提供建议,并且可以记住前文,能完成连续任务。
8.上海人工智能实验室(书生通用大模型)
https://intern-ai.org.cn
书生通用大模型是上海人工智能实验室研制的大模型。2021年,浦江实验室联合商汤、香港中文大学、上海交通大学发布通用视觉技术体系“书生”(INTERN)。如今,书生大模型体系参数已达千亿级别,包括“书生·多模态”、“书生·浦语”和“书生·天际”等三大基础模型,以及面向大模型研发与应用的开源体系。