近期,运营商移动网络通信故障时有发生,有些甚至导致全国范围内语音、数据、短信业务受到影响,波及银行、航空、物流、汽车、电力等行业,出现了送货状态系统无法更新、ATM机无法正常使用等情况。
运营商网络及业务的高速化、多元化发展固然很重要,这是吸引用户非常有效的手段之一,但我们也必须时刻谨记,电信网络设备及组网的高可靠及安全性,才是运营商和设备厂商的立身之本,没有了这个居于首位的1,后面即使有再多的0也没有任何意义。
随着5G核心网的持续演进和发展,在关注网元功能及性能的同时,也必须充分思考如何提升网元及组网的高可靠和安全性。下面我们将从PCC组网的维度,就这一问题展开探讨。
1 PCF容灾模式
从最初同局址部署容灾局,到后来地理容灾概念的引入,可以说运营商和设备厂商一直在追求更高的容灾能力,不仅在网络建设时考虑网元套数的冗余,还进而考虑异局址的部署;从2G/3G的全业务冷备容灾,到4G的语音业务热备容灾,再到5G的全业务热备容灾,可以说网元及组网的容灾等级也在不断提升。
现网PCF的组网主要分为两种模式,一种是N*(1+1)主备,一种是N+N负荷分担。接下来我们将分别就这两种组网模式的容灾方案进行说明。
N*(1+1)主备
组网:该容灾模式,由N个1+1主备pool组成。正常情况下,pool内主用PCF承担业务,主用PCF故障后,由pool内备用PCF承担所有业务。
路由:每个pool相对独立,pool之间不存在业务交互。对端网元根据号段(适用数据业务)或服务区域(适用语音业务)选择不同的pool。
注:N=1时为特例,对端网元无需区分号段或服务区域。
备份:根据需要决定是否同步用户会话数据,一般建议至少语音业务启用同步。
N+N负荷分担
组网:该容灾模式,由N+N套容量相同的PCF组成一个pool。只在其中两套PCF配置UDSF,pool内其他PCF共享这两套UDSF。pool内所有PCF优先访问同一套内置UDSF,另一套内置UDSF作为备用。
路由:正常情况下,对端网元将业务请求平均分发至pool内N+N套PCF,其中一套PCF故障后,由其他(2N-1)套PCF均衡承担该PCF上的业务。
备份:UDSF间必须启用数据同步,即该容灾模式只适用热备。
2 SPR容灾模式
现网SPR的组网主要分为两种模式,一种是1+1主备,一种是主备双活。接下来我们将分别就这两种组网模式的容灾方案进行说明。
1+1主备
所有PCF选取同一套SPR为主用,另一套为备用;签约数据和用量数据实时从主用SPR同步至备用SPR。
优点:组网简单。
缺点:PCF跨DC访问SPR,对传输网络要求较高。
主备双活
PCF尽量选取与自身地理位置相近的SPR为主用。签约数据实时从一套SPR同步至另一套SPR,用量数据双向同步。
优点:PCF可以尽量不出DC访问SPR,对传输网络要求较低。
缺点:组网较复杂。
3 第三DC容灾
为进一步提升容灾能力,在前文所述的双DC热备容灾的基础上,我们引入了第三DC容灾的方案,主要针对用户签约数据、用量数据、会话数据的第三DC热备同步及容灾接管。
SPR/UDSF的1+1+1容灾,第三DC SPR3/UDSF3平时不承担业务,只在业务切换到第三DC时才启用。签约数据、用量数据、会话数据实时从一套SPR/UDSF同步至另外两套SPR/UDSF。
优点:可靠性高,能容忍两个DC同时故障。
缺点:可能会因为第三DC设备状态不正常导致切换失败。
中兴通讯5G PCC高可靠组网方案,涵盖了前端业务网元的N*(1+1)主备、N+N负荷分担以及后端数据库网元的1+1主备和主备双活等多种组网场景,同时包含了区分业务粒度的热备容灾方案,并更进一步的提出了后端数据库网元第三DC容灾方案,全面满足了运营商对于5G PCC网元的高可靠组网及容灾要求,全面提升了网络的安全性。