信息谷 - ICITU

标题: 【光电通信】PON 网络故障分析与维护建议 [打印本页]

作者: vguangxian    时间: 2021-3-20 10:36
标题: 【光电通信】PON 网络故障分析与维护建议
1. PON 技术及应用
(, 下载次数: 134)
1. 1  PON 的定义和组成PON( Passive Optical Network,无源光网络) 是一种应用于接入网,在局端设备与多个用户端设备之间,通过由无源的光缆、光分路器等组成的光分配网连接的网络。PON 为点到多点的结构,由 OLT( Optical Line Terminal,光线路终端) 、ONU ( Optical Network Unit,光网络单元) /ONT( Optical Network Terminal,光网络终端)和 ODN( Optical Distribution Network,光分配网络) 组成,在 OLT 和 ONU/ONT 之间的 ODN 没有任何的有源设备。
1. 2 PON 应用及组网结构
现阶段主要应用的 PON 技术有 EPON 和 GPON,各种 PON 技术最大的不同在于其数据链路层协议,数据链路层协议规定了上层数据信号的承接方式。EPON( Ethernet Passive Optical Network,以太网无源光网络) 基于 IEEE802. 3ah 标准,是以太网与 PON的结合,其在物理层采用了 PON 技术,在链路层使用以太网协议,利用 PON 的拓扑结构实现了以太网的接入。GPON( Gigabit - Capable PON,吉比特无源光网络) 基于 ITU - T G. 984. x 标准,其在链路层采用通用成帧规程 GFP,扩展支持对 Ethernet、TDM、ATM 等多种业务封装成 GEM 帧后由 PON 传输。GEM 帧头包含帧长度指示字节,可用于可变长度数据包的传递,提高了传输效率,因此能更简单、通用、高效地支持全业务。随着高带宽业务的不断发展和用户侧接入技术的不断创新,用户接入带宽也不断提升,目前以 10G -EPON 和 XGS - PON 为代表的 10G PON 技术已逐步开展应用。PON 作为一种应用范围极其广泛的接入网络,其组网方式多种多样,基本的网络结构如图 1 所示。
(, 下载次数: 189)
2. PON 网络仪器仪表和网络工具
工欲善其事必先利其器,处理网络故障离不开各种仪器仪表和网络工具,善于使用这些工具,对于故障的解决能起到事半功倍的效果。
2. 1 仪器仪表
PON 网络装维常用到的仪器仪表有光时域反射计( OTDR) 、光纤熔接机、光功率计、红光源,此外还有PON 光功率计、PON 网络协议分析仪、回波损耗测试仪等。
2. 2 网络工具
通过综合运用网管系统和各种网络监测软件,获取网络状况和参数信息,对分析、定位故障原因非常有效。( 1 ) 使用 OLT 的网管系统或者远程登录到 OLT,查看相关设备的告警、运行状态、性能参数、数据配置等信息,实现对 PON 网络的性能监测。常查看的信息有:①OLT 性能及状态( 板卡状态、CPU/内存占用率、工作温度等) 、系统告警信息、系统日志。②ONU 状态( 是否在线、离线原因及时间) 、ONU接收光功率及 OLT 接收 ONU 光功率、ONU 端口状态( Up/Down、速率、双工模式) 、ONU 端口学到的 MAC地址、ONU 端口流量、ONU FEC 统计信息。③PON 口状态、流量情况及 PON 口下已注册ONU 的数量、测距信息。④OLT 上联 GE、XGE 端口的状态信息 ( Up/Down、速率、双工模式、带宽利用率、CRC 错误帧数量等) 及光模块的相关信息( 厂家型号、接收/发送光功率及其阈值等) 、端口是否加入聚合组及聚合组状态信息。⑤OLT 的全局配置及相关的业务配置。⑥OLT、ONU 的软件版本号。( 2 ) 通过 Cacti 软件实时监控 OLT 上联口及各PON 口的流量状况,对端口流量短时间内变化大、带宽占用较高等异常情况进行排查。( 3 ) 灵活使用相关网络命令。例如使用 ping 命令测试网络状况,查看网络时延、丢包率等指标。( 4 ) 借助 Wireshark 等抓包软件分析网络故障。
3. PON 网络故障处理整体思路和排查方法
3.1 整体思路
1) 首先定位故障范围。①全区域性网络故障。机房某个 OLT 下所带区域都出现故障,可定位故障位置在 OLT 上联链路或OLT 设备本身。②区域性网络故障。根据故障区域的范围大小再区分,如故障范围较大,包括众多小区或某个一级光交箱下面所带小区,可定位故障位置在 OLT 的某块业务单板,或从机房至光交箱的主干光缆上; 如故障范围包括的小区较少或只有某个小区的部分区域,可定位故障位置在离故障较近的光交箱及光缆线路,或 OLT 的某个 PON 口上。③单点性网络故障。故障范围只限于某个楼或单元,或 FTTH 的某个用户,可定位故障位置在离故障较近的光节点及光缆线路,或 ONU、交换机等设备上。( 2) 故障排查方向为从光链路到数据配置①确认 ODN 及相关设备是否出现人为变更。如有改动网络拓扑结构或更换、增减了网络上的器件设备,需重点排查。②逐级检查光链路及设备是否正常。通过网管系统查看或用仪器仪表实地测量,确认设备的状态及各项性能参数是否正常,相关光器件及整体光链路的光传输特性指标是否符合要求。③检查网络设备的数据配置。主要检查 OLT 上的配置是否有改动,相关业务配置是否完整准确。
3.2 排查方法
( 1 ) 观察测量法。通过对网络上各环节所涉及的链路、器件和设备等采取直接观察和测量相关指标的方法,有助于快速定位故障源。例如观察设备的各种指示灯是否正常,设备及光器件等是否有损伤; 使用光功率计、OTDR 等,测量光链路损耗是否合理。( 2 ) 排除法。通过对故障现象、故障时间、影响范围等各方面情况进行汇总,按照一定的排查顺序,分级、分段进行分析判断,逐个因素地排除,逐步压缩排查范围。( 3 ) 替换法。当通过观察测量法无法确定某个设备或器件是否有问题时,可尝试对其进行替换或接入到另一正常网络环境中测试。在缺少必要仪器仪表辅助的情况下,或维护人员以往经验存在局限性时,直接采用替换法,不失为一种快捷有效的方法。( 4 ) 性能指标分析法。通过网管系统和各种网络工具,获取网络和相关设备的各项性能指标参数,再综合各方面信息后分析、判断故障原因。
4. PON 网络故障分析及维护建议
对于 PON 网络中可能出现的故障,归纳起来大致可分为四个方面: 光链路、设备软硬件、业务应用及其他故障。
4.1 故障现象
PON 网络的故障现象,在 ONU 和用户侧主要表现为:( 1 ) ONU 状态异常。常见的异常状态有: ONU 无法注册、ONU 配置失败、ONU 频繁上下线等。( 2 ) 网络不通或网络不稳定,网速慢。具体表现为宽带拨号连接失败或频繁掉线、网络时延大、抖动大、丢包率较高等问题。
4.2 光链路方面故障
光链路主要由光模块、光纤/光缆、光纤连接器( 跳纤) 、光纤适配器( 法兰盘) 、光分路器、光衰减器等部分组成,特别是 ODN 中的无源光器件、光纤接续点等部分是容易引发故障的环节。光链路方面的故障大多是由于光链路自身某些环节出现问题,导致光信号的光功率、误码率等指标不正常而引起的,此外还有 ODN 中接入了长发光设备的光信号,造成 ONU 无法正常注册的情况,下面分别进行分析。( 1 ) 光链路自身某些环节出现问题通常光链路质量差时不仅会增加光信号的衰减,同时也会加大光信号的后向反射,干扰光模块正常工作,继而使链路误码上升。当接收端没有收到光信号,以及光信号的光功率过高或过低,超出了光模块接收饱和度或灵敏度的阈值,或者处于阈值的临界附近,从
而产生故障。
对于无光信号的情况,光链路上一般是由于光纤断、光分路器等光器件损坏,造成光信号直接中断或者衰减特别大,此外还有光模块坏、光口未开启等因素。而由光信号光功率低引起的故障较为常见,这通常是由光链路上存在非正常的光信号衰减造成的。在ODN 中,光信号衰减一般由两部分组成,一种是光缆本身产生的衰减,另一种是光链路中的连接( 熔接、冷接、光分路器、活动连接器、快速接头) 等产生的衰减。此外当光信号衰减没有明显异常而误码却大大增多的情况需格外注意。( 2 ) ODN 中存在长发光设备的光信号长发光设备主要有异常发光 ONU 和光纤收发器、光端机等,在 ODN 部署、维护过程中要格外注意,切勿把光纤收发器的光信号等非 PON 光信号误接入ODN 中。异常发光 ONU,俗称“流氓 ONU”,指 PON 系统中那些在没有被 OLT 授权时隙内发光的 ONU。PON 上行采用的是时分复用技术,如果存在流氓 ONU,其上行长时间或短时间占用了其他 ONU 的通信时隙,带来的影响就是流氓 ONU 所在 PON 口下的其他 ONU 无法正常工作。如果流氓 ONU 是长发光,则同一 PON口下其他的 ONU 将一直无法上线; 如果是乱发光,则同一 PON 口下其他 ONU 可能会出现反复上下线的现象。流氓 ONU 可分为两类:①发射异常而接收正常,为可控光源 ONUOLT 针对此类 ONU 的处理一般分为三个过程: 检测、排查、隔离。检测是定时对 PON 口进行测试,检查是否存在流氓 ONU。排查是确定具体哪个 ONU 是流氓 ONU,排查过程中所有 ONU 都会下线,会影响 ONU的正常业务转发。隔离是对 ONU 下发指令,关闭ONU 光模块的发送电源,禁止其上行发光,从而消除流氓 ONU 对 PON 口下其他 ONU 的影响。通常 OLT只默认对流氓 ONU 做检测,不进行自动排查和隔离。②发射接收都异常,为不可控光源 ONU此类 ONU 无法通过 PON 系统中的远程诊断手段排查,一般情况下需要进行人工现场排查。排查时通常是在 PON 口的一级分光器位置,逐纤断开分光器的输出口连接,测量对端光纤有无光信号,以判断是否存在流氓 ONU; 再用同样方法逐级测量,直至确定流氓ONU 位置。( 3 ) 光链路故障排查建议
①首先要熟悉整个 ODN 的拓扑结构,计算出光链路的总损耗。将光链路中各种光器件的插入损耗、光纤的传输损耗、光纤接续点的熔接或冷接损耗以及线路冗余损耗相加,从而得出总损耗。ODN 出现问题一般是由于设计、施工、光器件选用不合理等因素导致的光链路中反射较大、衰减较大而引起的。②PON 系统下行波长采用 1 490 nm,上行波长采用 1 310 nm,在日常 PON 网络维护和故障处理时,需同时关注上行和下行两个方向的光链路质量,像视频监控等上行流量较大的业务,更需注意上行方向的光信号衰减和反射情况。在实际 PON 网络中,往往上行链路损耗较大、链路质量较差。③排查光链路故障时应包含 OLT 上联链路和ODN 两个方面。当网络不稳定时,可从 ONU 端分别ping OLT 管理地址、BRAS 上设的 OLT 网关地址,通过比较时延值和丢包率,来帮助判断是哪方面有问题。④通过定期测量、记录光链路的相关状态参数( 接收光功率、发送光功率、光模块工作温度、电压、偏置电流等) 并对历史数据进行关联分析,实现对光链路性能的监测,并提供预测和预警功能。
4.3 业务应用方面故障
业务应用方面的故障主要是由于业务的各项参数配置错误或参数不匹配引起的,故障排查主要依靠人工检查数据来实现。( 1 ) 业务应用方面常见问题①VLAN 参数配置错误或与 BRAS 配置不匹配。②DBA 模板、线路模板、业务模板等模板参数配置错误。③组播等相关业务参数配置错误。④ACL 配置错误; QoS 参数配置错误; 安全策略引发的业务故障。⑤上联、下联接口参数配置错误,如速率、双工模式、LACP 协议参数等。( 2 ) 业务应用配置、维护建议①OLT 新开局时,OLT 与 BRAS 双方维护人员应协商好相关数据配置,包括 VLAN 设置、端口模式、链路聚合模式等; 线路调试人员应将所有相关资料,如组网方式、PON 口分配等交接给数据配置人员,使配置人员明确知道 PON 口位置对应关系等信息,及时开启PON 口、使能 PON 口发现功能,配置相关业务数据。②每次添加、更改配置时,要反复核对,确认无误、保存数据后再退出。③定期导出、备份设备配置信息; 保管好设备登录用户名和密码,并定期更换密码。
4. 4 PON 设备软硬件方面故障
( 1) 设备硬件方面问题。①OLT 性能问题。因机房温度高、OLT 风扇故障、导风口堵塞等造成的 OLT 板卡温度过高,或者 CPU/内存占用率高等因素,会导致 OLT 性能严重下降,影响网络稳定运行。需排查造成 OLT 板卡温度高、CPU / 内存占用率高的原因,必要时重启 OLT 以及咨询 OLT 厂家技术人员。②OLT 单板或槽位故障。PON 板出现故障,整块PON 板下所有 ONU 都无法上线,首先更换 PON 板槽位,如果故障未排除,再更换 PON 板。OLT 通常有两块主控板,当出现 OLT 能 ping 通但无法登陆时,可拔出当前在用主控板( ACT 灯亮的为在用) 后自动切换到备用板,如故障排除,插回主控板,再登录系统查看板卡状态。③PON 口故障。PON 口出现故障,PON 口下全部或部分 ONU 无法上线,首先排除 PON 口未开启和未使能 ONU 自动发现的情况,其次更换 PON 光模块,如果故障未排除,再更换 PON 口。④ONU 故障。先检查 ONU 有无掉电、进水或损坏,对于因 ONU 自身问题而出现状态异常、业务不通、网络不稳定等问题,可先查看 ONU 光口有无堵塞或污损、ONU 自带尾纤有无断裂或弯曲过大等情况,再用替换法来排查。此外,ONU 电源问题( 电解电容容量降低,电源纹波加大) 也会使 ONU 工作不稳定,如ONU 为外置电源,可先更换电源来排查故障。

( 2 ) 设备软件方面问题

对于 PON 网络出现的某些具有共性的故障,例如某型号的 ONU 普遍出现时延大、丢包率高的情况,某型号 OLT 下的组播视频业务出现黑屏、卡顿的情况等等,在光链路和设备硬件、业务配置等方面排查不出问题时,需要向设备厂家的技术人员反馈情况,咨询一下出现问题设备的软件版本是否存在已知的 BUG、是否软硬件版本不匹配、是否需要升级软件版本、打补丁等。必要时联系设备厂家技术人员进行远程或现场故障排查,并由设备厂家提供或开发新的软件版本,经测试正常后再对全网设备进行软件版本的更新升级。( 3) 设备维护建议①在对 OLT 单板、光模块等部件进行安装维护操作时,要采取佩戴防静电手环等防静电措施,确保设备不受到 ESD 损伤。②定期对 OLT 进行清洁,着重清洁风扇、导风口等部位; 对 OLT、ONU 的空闲光口要盖好防尘帽。③注意监测 OLT 工作温度、性能、板卡状态等情况,发现异常及时处理。
4.5 其他方面故障
在 PON 网络中,除了以上三方面的故障,还可能出现一些由用户侧网络异常、链路带宽瓶颈、工作环境、供电等方面引起的故障,例如: 用户侧网络存在环路; 电源功率不足、电压不稳等供电问题; 环境温度过高或过低引起的故障; 电磁干扰引起的故障等等。( 1 ) 用户侧网络存在环路因楼道交换机、用户路由器上的网线接错或着用户自己组网异常等原因造成的二层环路,使大量的广播包被反复转发,导致设备性能下降、带宽占满,最终用户侧网络瘫痪。为避免网络中产生环路,降低环路造成的危害,建议如下:①合理规划、配置 VLAN,减小广播域。对于 OLT有级联设备的情况,建议对 OLT 和级联设备分别配置不同的 VLAN 范围。②使能 ONU 端口之间、ONU 之间、PON 口之间的隔离,对在同一个 OLT 下有 VLAN 内互通要求的业务单独去隔离。③在楼道交换机等设备处,用户网线和设备级联线要标识清晰准确,线缆整齐有序。( 2 ) OLT 上联口或 PON 口存在带宽瓶颈如果 OLT 上联口或 PON 口在流量高峰时带宽占用高,出现瓶颈现象,会导致网速慢,影响用户体验。建议定期关注 OLT 上联口及 PON 口流量情况,及时扩容上联带宽,并对流量较高的 PON 口进行分拆,以保证带宽利用率处于合理水平。
5. 结束语
PON 网络作为目前运营商最主用的接入网,负责将宽带、视频、语音等多种业务传送给用户,作为“最后一公里”,其日常维修维护量也是最大的,遇到的故障种类和因素也是多种多样的。因此,建议我们维护人员在处理 PON 网络故障过程中,能及时记录、分析、总结故障原因和处理方法,逐步建立并完善一套故障案例库,为以后 PON 网络建设应用和运行维护提供参考和技术支持。





欢迎光临 信息谷 - ICITU (https://icitu.com/) Powered by Discuz! X3.4