5G时代,基于音视频的多媒体实时通信作为运营商的核心服务之一,满足了全球80亿人的基本沟通需求,是运营商不可或缺的基本业务能力。随着5G网络连续覆盖的逐步实现,以及5G VoNR高清通话业务的商用,5G与5G-Advanced的大带宽、低时延等特性为高清音视频通信能力升级提供了坚实的网络基础。新一代多媒体实时通信业务和通信技术的需求与运营商网络架构的演进互为依托、相互促进,随着网络承载能力的增强,多媒体实时通信业务的发展逐渐呈现超清化、交互式、沉浸式、开放性等趋势。
VoNR和IMS/VoLTE网络架构主要面向基础音视频能力,无法满足交互式实时通信需求。中国移动基于3GPPIMS(IP Multimedia Subsystem)数据通道(Data Channel)技术标准,提出了全新的“VoNR+”技术体系架构,即在VoNR网络上搭载新的数据通道及智能媒体处理能力,为用户提供更为丰富的交互式超清智能通话业务体验。同时,通过引入更加灵活的开放架构,便于第三方通话类应用入驻,构建多维度、交互式实时通信新生态。
“VoNR+”是在VoNR基础上实现网络架构创新,同步兼容基于音视频和数据通道能力的实时通信数据传输,为交互式、沉浸式通话业务提供核心网络能力底座。作为“VoNR+”实时通信网络和业务生态的核心技术,数据通道相关标准已在3GPP、GSMA、ITU-T、CCSA等国内外产业组织同步制定,“VoNR+”实时通信网络架构通过与数据通道技术结合,对VoNR话音能力进行增强,可促进传统音视频能力与其他新媒体的创新性融合,突破传统通信模式的束缚,开启崭新的人与人、人与物、物与物之间的全媒体实时通信时代。
“VoNR+”网络系统架构
“VoNR+”网络系统架构以实时通信基础层为底座,由实时通信能力层进行创新能力扩展,结合实时通信使能层对接运营商自有创新业务、第三方业务以及to B行业应用等;并以统一媒体面为依托,使媒体能力具备更强的灵活性和扩展性,以应对未来日趋多样化的实时通信多媒体业务需求。
实时通信基础层:基于基础音视频网元构建,兼具传统音视频与“VoNR+”媒体新能力的媒体控制、呼叫控制、事件通知与协议适配等。
实时通信能力层:作为能力中台,在基础音视频能力之外,通过新增IMS数据通道提供实时交互、实时共享、远程控制等能力,将用户感官从“听”和“看”,扩展到“可触摸”“可远程操作”等更丰富的体验。
实时通信使能层:通过开放业务能力,提供编排化引擎、场景化引擎、资源管理调度等,从而支持更多垂直行业使用运营商音视频与数据通道能力。同时作为业务的统一管理门户,支撑多样化的应用生态,如运营商自有创新应用、第三方应用、行业应用等,引入更多行业伙伴共同参与,实现运营商网络价值的最大化。
统一媒体面:随着AR/VR等通信新媒体的涌现,网络侧需具备更灵活的媒体处理能力,并提供更高效的媒体路由。“VoNR+”统一媒体面面向5G-Advanced业务需求,除具有传统音视频、放音、会议等媒体能力以外,同步支持基于数据通道传输的AR/VR媒体元素、文件数据等,且具备媒体合成、渲染处理、统一媒体管理等功能,可有效支持“VoNR+”新业务快速上线。
“VoNR+”网络关键技术能力
“VoNR+”是不同于现有话音业务及架构的新理念,将运营商的话音网络发展成为一个具有趣味性、便捷性、拓展性的实时通信网络。面向交互式新业务需求,构建“VoNR+”新网络架构,升级网络新技术能力,运营商积极开辟实时通信网络新产业生态。
全新通道
3GPP R16 TS 26.114定义了Web RTC数据通道技术标准,R18NG_RTC项目进一步制定了IMS数据通道及其关键技术标准,实现了数据通道关键技术与IMS网络的创新性标准化融合。
IMS数据通道是在IMS已有的语音和视频会话通道基础上增加的一种全新通道,以满足全类型数据的传输要求,而这些数据的传输将与音视频会话同步。
IMS数据通道如图1所示,其构建在运营商的话音网络之上,通过电信网络固有的码号优势,进行统一认证、会话管理与QoS控制,并结合终端侧的通用Web架构,实现“VoNR+”业务的强交互式需求,主要分为以下两种通道。前导数据通道(Bootstrap DataChannel)是终端通过该通道获取应用程序列表以及下载应用程序。应用数据通道(Application Data Channel)是终端通过该通道传输应用数据以及实时交互动态业务数据。
图1 IMS数据通道
媒体智融
“VoNR+”网络采用控制面和媒体面分离的设计架构,同时具备基于视频和数据通道的交互式媒体能力,主要包括以下几种能力。
数据通道接入能力:作为数据通道媒体资源的锚定点,在控制面的指示下,与终端建立数据通道并完成媒体数据的交互。
媒体转发服务能力:实现终端之间、终端与其他传统媒体设备之间的音视频流和数据通道媒体流转发。
兼容基础音视频处理能力:具备基础音视频播放、音频会议、视频会议等能力。
AR新媒体能力:可按需提供AR标记、AR媒体渲染等新媒体能力,帮助“VoNR+”应用构建身临其境和虚实融合的沉浸式体验。
AI处理能力:包括语音识别、手势识别、语音合成等功能。
服务化会话控制
IMS/VoLTE网络对媒体面的控制普遍采用H.248协议,解耦困难,不利于快速满足新型媒体能力需求。“VoNR+”网络首创性地在IMS会话媒体控制层引入基于HTTP/2协议的服务化架构,统一媒体面基于服务化媒体面接口与控制网元进行协商,完成数据通道媒体资源的预留、创建、转发等操作,使媒体功能架构具备更强的灵活性和可扩展性,满足未来多样化的“VoNR+”业务媒体调用需求。
“VoNR+”网络展望及倡议
“VoNR+”开启了全新的多媒体、全交互实时通信时代,实现从视听通信到全感通信的飞跃。在标准化实践层面,中国移动已助推3GPP、GSMA、ITU-T、CCSA等国内外产业组织初步形成标准化体系,从业务需求、网络架构、信令流程、接口协议等多维度开展工作,并制定了多个企标规范,明确了“VoNR+”相关技术要求、设备要求、接口要求等,有效促进业界达成一致理解,助力“VoNR+”的产品化落地。
在产品化实践层面,自2022年开始,中国移动已在多个省份联合华为、中兴和vivo等相关厂家开展“VoNR+”网络试点验证,并积极推进首批“VoNR+”业务的正式商用。
“VoNR+”产业的发展,依赖于IMS数据通道标准的成熟度以及网络设备、终端和芯片厂家的产品化进度。“VoNR+”的繁荣发展需要产业各方通力协作,持续丰富业务形态、探索商业模式,共同打造开放、合作和共赢的互利生态,最大化释放网络价值。