网络工程工作注意细节

speed nonegotiate:

在cisco的交换机中,千兆光接口是需要协商才能确定传输速度的,当两边的端口速度、频率不一致时,将导致交换机光口无法正常使用。因此,需要使用speed nonegotiate来取消协商。
可能有的认为,我两边是auto还不行吗?答案是对于千兆网卡这样不行。这是因为千兆的通信标准与以前习惯的100M自适应有差别,简单而言:
100M端口:auto—-10M,FULL,auto一方会变成10M,half,可以正常通讯,但是会丢包,流量大的时候性能会极大下降。
1000M端口:auto—-100M,FULL,则auto会down,这是1000M的标准定义的

中兴清配置:

我们都知道cisco的交换机清除配置是erase startconfig !然后reload就可以了。
但是ZXR10系列的交换机没有这个命令,ZXR10保存配置是write ,有就是把配置信息write到flash中,在flash下有个cfg文件夹,里面保存的就是我们write进去的配置文件,只要把这个文件删除,重启交换机就可以了。
具体命令为:
ZXR10#CD   CFG   //切换到保存配置文件的文件夹
ZXR10#DIR     //查看文件
Directory  of flash:/cfg
ZXR10#delete  startrun.cfg
Are you sure to delete files?[yes/no]:y
ZXR10#reboot
ZXR10#Confirm to reboot?yes/no]:y
等交换机重启完成后,配置就清除了!

ONU的长发光问题

EPON系统中什么是ONU的长发光?

长发光定义

是指持续有光。(或长时间有光)
首先EPON的ONU是突发光的,OLT是长发光的。这是由于EPON和工作机制决定的。数据从OLT到ONU,称为下行,EPON的下行是广播形式的,OLT会不断发出信号给ONU.所以它是长发光的。  但ONU不一样,上行的数据时,ONU会先发出上传信号,才会上传,所以它是突发光的。

长发光故障的现象

现象一:用户端ONU的PON灯一直闪烁(链路正常),无法注册上线;一个PON口下只有一个onu上线,其他的onu都下线(提示link-down状态);

现象二:用户端ONU业务不稳定(ONU掉线);一个PON口下大量ONU持续出现上下线;PPPOE拨号中断;一个PON口下大量ONU出现OAM协商阶段,下行数据业务中断。长发光故障的原因

两大类:一类归结为PON 芯片控制软件故障,另一归结为光模块硬件故障。前者是指ONU 的PON 芯片内部负责控制光模块打开和关闭的状态机或寄存器由于某种原因产生异常,无法在正确时刻产生正确输出; 后者是指PON 芯片本身是正常的,能在正确时刻发出打开和关闭光模块的命令, 但ONU 光模块或辅助电路发生故障,不能正常响应PON 芯片的命令。如果ONU长发光故障,甚至是完全不受控制的长期发光(持续长发光ONU),就会对xPON 中的协议报文(MPCP) 和OAM 帧都产生干扰,导致整个PON 口下的大量ONU 都无法上线或则业务不正常,使整个PON 口都退出服务!

长发光故障的排查

方法一:人工排查,起初部署xPON 网络时, 当出现PON 口下大量ONU注册失败或则业务不正常时,维护人员首先要通过光功率计查看是否上行有长时间漏光。这种方法只能检测到硬件故障的ONU, 却很难检测到软件故障的ONU。在确认有ONU 后,首先要由现场人员在分路器处尝试拔掉1 根分支光纤,然后再观察其他ONU是否能注册上;如果其他ONU 都仍不能注册,就再尝试拔掉下一根分路光纤。方法二:软件处理机制,随着EPON技术的成熟,通过OLT自动检测机制与自动处理机制隔离故障长发光ONU,在设备日志或则网管软件可以告警提示及定位到该ONU物理地址,以便现场更换故障设备。

实际排查案例:

故障现象:olt该pon口下的所有设备出现断网的情况,登录进设备看是不是有流氓设备抢占了上行发光的时间碎片而导致产生长发光问题,结果查询之后发现所有onu设备都是无法进行注册,都是反复注册,每次都是注册失败,但是过了十来分钟之后,又全部注册成功恢复正常了,当时就不敢再进行测试找出问题设备,因为会影响用户上网。
故障分析:

1)接到电话后第一反应就是有流氓设备占用了是见碎片,导致其他设备无法进行注册,登陆设备查询报警信息,查看是否有长发光告警以及其他类型告警;

2)咨询使用环境情况,是否下雨打雷(野外型ONU时要关注的)、天气温度情况(夏天要关注的)、使用环境是否有其他电磁、高压用电器等(用户家里关注的);

3)查看下行光功率是否衰减过大,也有可能是是下行光衰减过大造成的掉网;

4)咨询了解现场情况、结合查看的告警信息、ONU光功率的监控信息、以及观察掉网的ONU的规律性(同一个PON口?同一个OLT?同一个光分路?等等)。

5)对于类似的问题,要多了解、多分析。多收集相关信息,这样才能更好的快速及时定位故障,解决故障点,恢复实网。

总结:对于实际应用时,由于网络的复杂性,不能单单考虑一种类型故障,要多种类型故障结合分析是否为长发光故障;长发光故障ONU 可能存在于正常使用中,由于运行时间加长、环境温度波动、器件老化等因素而产生;各个厂家针对ONU长发光故障,有不同的检测机制与处理机制;但是最终目的都是达到定位、隔离故障ONU的目的。