第4章 ASON网维护实战
ASON即自动交换光网络。在以往的SDH中,有传送平面(又称业务平面)和管理平面,在ASON中引入了控制平面,该平面的引入带来了不同的重路由恢复方式。目前各厂家的设备基于相同的原理,但实现细节不一致。在本节,我们以华为和朗讯的设备为例为大家介绍ASON的一些维护心得。
4.1 华为ASON设备维护实战
4.1.1 华为ASON设备日常维护注意事项
华为ASON设备在日常维护中应注意如下几点事项。
(1)在日常维护中保证业务的完整和属性不变是非常重要的。在网管智能电路管理视图中,可以查看当前全网智能业务的详细信息,首要检查业务数目是否跟之前的数目一致,然后检查业务属性是否发生变更,包括该业务的激活状态、保护类型、重路由锁定状态和重路由优先级(重点关注激活状态)。
(2)智能业务降级事件。检测到有智能电路降级发生后,要采取正确的措施对业务进行处理。
① 若为正常降级,则不需要处理;
② 若为异常降级,但业务仍然是通的,且不存在残留信令,则应通过升级操作将静态业务升级为智能业务;
③ 若为异常降级,且降级后业务存在残留交叉,则应采取相应措施清除残留交叉,并重新建立业务(或直接补全静态交叉),然后升级为智能业务。
(3)可以端到端配置业务,也可以分段配置业务。采用分段方式创建智能和非智能业务时,应注意:创建结束后,必须进入“SDH路径管理”窗口进行路径搜索,形成SDH业务路径,否则在路径管理中将看不到这条业务,只能看到智能电路部分,这样在日常维护及故障处理时,由于不能立即查询到这条电路的全部信息,可能会延长故障历时。
同样在进行删除该类型业务时,也必须分段删除,否则会产生残留交叉业务,必须在SDH离散业务管理上手动删除。
(4)定期清理离散业务。在网管系统上进行路径搜索,无法形成路径的交叉连接称为离散业务,离散业务包含垃圾交叉、缺陷业务和特殊用途交叉连接。
垃圾交叉是指不具备电路承载能力,且不具备业务保护能力的交叉连接,这类交叉业务没有任何意义;缺陷业务则可能用于实际的电路承载,但用于交叉连接时不符合组成完整电路的条件,因此同样被归为离散业务,由于它存在承载电路的可能性,故不能随意删除,否则可能影响在用电路;特殊用途的交叉连接主要用于在某种网络故障场景下提供保护路由,或提供给客户做其他用途,在网络上存在的较少。
垃圾交叉的存在会对网络运维造成诸多不利的影响,主要包括:电路安全性存在缺陷(如缺少保护路由或缺少工作路由);业务配置困难(路径端到端配置过程中会出现时隙冲突);资源统计报表不准确(T2000的部分统计报表不包括离散业务占用的资源);影响网络管理、故障定位、诊断等(缺陷业务不在路径报表当中,无法看到完整的路由,如果出现中断,定位会非常复杂);浪费大量网络资源(如线路带宽资源、支路端口资源、低阶交叉资源等);限制网络的业务支撑能力等。
(5)解决故障的常用方法包括:光纤中断、光纤环回、换插光纤、单板复位、主控板复位、换插单板、拔插单板、更换单板、更换主控板等。(其中换插光纤操作在引入ASON后被禁止使用。)
① 光纤中断:如果需要频繁地开关激光器,最好先将电路优化到其他路径上或者锁定电路的重路由功能,再进行此操作。开关激光器将导致业务中断,并触发智能电路重路由。在开局或维护过程中,可能未上业务,对业务是否中断不关心;但频繁地开关激光器势必引起频繁的重路由,这是维护过程中不希望看到的,并且对系统的稳定性也有一定的影响。因此建议在需要频繁开关激光器时,最好先将智能电路优化到其他路径上或者锁定电路的重路由功能。
② 光纤环回:如果需要频繁地环回和去环回,最好先将电路优化到其他路径上或者锁定电路的重路由功能,再进行此操作。原因同①,频繁地环回和去环回也会导致告警的不停变化,会触发业务重路由,并可能使可恢复式重路由业务错误地恢复,因此建议先将电路优化到其他路径上或者锁定电路的重路由功能。
③ 换插光纤:通常情况下被禁止使用。如果的确需要进行此操作,需要先把相关光口上的电路优化到别的链路,然后禁止此光纤的LMP校验功能(控制通道和TE链路),并手动设置此TE链路远端信息为0。操作结束后,再恢复原有ASON配置。
④ 主控板复位:最好不要在建立/删除业务、重路由的过程中复位主控板。由于智能业务的建立、删除、优化、重路由等处理过程都需要主控板的参与,如果正在上述处理过程中复位主控板,可能会造成业务的丢失或数据不一致,主控板重启后,就可能会产生残留交叉,或者一些业务被错误地删除。因此,最好在网络稳定的情况下进行复位操作,重启后巡检系统看有无异常发生。
⑤ 更换主控板:更换主控板前需要保证数据库能够完整地移动到新主控板上,可以利用主备主控功能或CF卡。主控板复位的限制也适用于更换主控板。
(6)网管软件在正常工作时不应退出,尽管退出网管系统不会中断网上的业务,但会使网管在关闭的时间内对智能软件失去监控能力,破坏对智能软件监控的连续性。
另外,也要保证网管计算机的安全性,防止损害网管计算机系统,导出脚本至U盘之前,一定要确保U盘无病毒。
4.1.2 华为ASON设备配置智能业务失败类型
根据网管错误提示的类型区分,在配置智能业务时有6种失败类型,如表4.1所示。
表4.1 配置智能业务时的失败类型
4.1.3 华为ASO N设备业务中断处理流程
ASON网络业务中断的原因主要分为两种:客户侧故障和ASON网络故障。当业务中断时,故障处理思路如下。
(1)查询告警,确认哪些业务发生中断,并将已中断业务的源端口和宿端口记录下来。
(2)排除客户侧故障,通过网管查看相关业务单板有无硬件告警,单板端口有无LOS、LOF、AIS和误码告警。
(3)如果客户侧均正常,通常需要定位发生中断的业务,然后采取优化或重建的方式处理。具体步骤如下:
① 查看中断业务的“激活状态”。如果激活状态为“部分激活”或“未激活”,则按照下一步进行处理。
② 选择中断业务并单击右键,选择“去激活”。如果去激活成功,继续下一步;否则选择中断业务并单击右键,选择“强制去激活”。
③ 选择中断业务并单击右键,选择“激活”,如果激活成功,故障解决;如果激活失败,继续下一步。
④ 选择中断业务,单击“维护”按钮,选择“优化”。将该业务优化到其他路径,如果优化成功,故障解决;如果优化失败,继续下一步。
⑤ 根据记录的故障业务信息,创建传统SDH业务以恢复业务。
4.1.4 华为ASON设备业务的保护与恢复
保护:这里主要指保护倒换。保护倒换是在故障发生之前,预留专用于保护的网络资源,从而当故障发生时,业务流从故障路径切换到保护路径进行传送。ASON支持的保护类型有SNCP(子网连接保护)和MSP(复用段保护)。
恢复:这里主要指重路由。重路由是一种业务恢复方式。当底层传输通道上出现故障,导致LSP中断时,LSP首结点查询业务恢复的最佳LSP路由,然后逐跳向下游结点发送信令,请求保留资源并建立交叉连接;末结点逐跳向上游结点回送信令,最终建立新的LSP。
ASON可以根据客户的需求层次的不同,提供不同服务等级的业务。SLA(Service Level Agreement)就是服务等级协定,从业务保护的角度将业务分成多种级别,如表4.2所示。
表4.2 ASON的SLA级别