近日获悉,阿里M6大模型的前带头人杨红霞已加入字节AI Lab(人工智能实验室),参与语言生成大模型的研发。
一名知情人士表示,杨红霞在语言生成大模型团队中处于领导地位,直接向字节跳动副总裁杨震原汇报。
杨红霞曾是阿里达摩院超大规模多模态预训练模型M6的技术负责人,毕业于南开大学、杜克大学统计科学系,师从著名统计学家David Dunson。
她在人工智能领域国际会议、顶级期刊有近百篇顶级论文。
2022年9月初,杨红霞因个人家庭原因从阿里巴巴达摩院离职。M6是阿里巴巴达摩院研发的超大规模多模态预训练模型,而大模型是本轮AI浪潮中的竞争核心。
杨红霞曾带领M6大模型从百亿级进化到千亿、再到万亿的参数量,并且主导认知智能技术的发展和场景落地。2021年3月,M6大模型首次发布,到2021年底,阿里云发布M6最新进展时,其参数已至10万亿,成为当时全球最大的AI预训练模型。