CAN优先级倒置原因与对策

分享到:

CAN总线是代表性的基于消息优先级进行调度的事件触发协议。为了保障通信的正常运行,必须实现帧开始时的硬同步以及无帧发送时的毛刺滤除。在现有CAN总线协议中,这2个设计的组合在特定场合会引起高优先级消息失去与同时发生的低优先级消息的竞争机会,即优先级倒置。优先级倒置的后果是高优先级消息的送达时间延迟,送达时间的理论分析结果不再正确。在完全兼容CAN总线的条件下,提出了在总线空闲时以及在服务间隔第3位处理毛刺的方法。它对于优先级倒置有改进,但对于毛刺较长而与低优先级消息帧开始位(SOF)相连引起的倒置仍无法解决。

CAN总线起始于1986年左右,至今仍广泛应用。现在人们对安全的要求已大为提高,所以要不断仔细审视CAN的安全性能。现在已经发现的重要的CAN问题有:在消极报错状态下可能出现等效离线,使节点不能收发的时间相当长[1];错帧漏检率的估计不准,特别在误码率高时比Bosch CAN2.0数据高多个数量级[2],在单目的地址时影响数据正确性,在多个目的地址时会影响数据一致性;标准的振荡源精度要求偏低[3],使误用廉价器件成为可能,影响系统的稳定性;本文发现的优先级倒置的可能性,使调度分析结果的可信度下降;在数据帧倒数第二位的局部错可能引起不一致的接收重复或丢失[4]。所以在FlexRay尚未达到预定目标、无论在可靠性还是价格上能取代CAN以前,对CAN作进一步的改进仍然是非常有意义的。

CAN是一种代表性的事件触发通信协议,同时发生的多个通信请求将按照消息的优先级进行无损仲裁,高优先级的胜出。按照消息的优先级进行无损仲裁是CAN原始专利的唯一权利要求[5]。对于低优先级的消息而言,送达时间将受到高优先级消息的阻扰,在高优先级消息为周期性时,最坏送达时间是可以预先计算出的[6]。如果能安排好发送消息的初始相位并作宽松的时钟同步,这个最坏送达时间可以大为减少。事件触发协议的优点是总线带宽可以得到充分利用。另一个优点是高优先级消息可得到迅速发送。但是由于工业环境中普遍存在的电磁干扰,总线上会有毛刺,CAN总线的标准中已考虑到应对方法。现在发现毛刺应对方法可能使节点的同步受到影响,从而损及高优先级消息的发送机会,出现优先级的倒置,动摇了CAN总线的基本性能。

1 毛刺的存在

车内电磁环境恶劣, ISO 76372/3总结出代表性的传导和辐射干扰。有人专门作了辐射干扰的实验,参考文献[7]的实验中用24 V蓄电池给车内常用的继电器供电(CAN系统供电是独立的),电源线与CAN电缆靠得很近,在电缆线有屏蔽、线长为2 m时,手动开关继电器时可以看到CAN波形上叠加的毛刺,辐射干扰实验结果如图1所示。

 

图1 辐射干扰实验结果

实际汽车上也见到CAN总线失效的报告[8]:丰田汽车在经销商产品报告中确认,由任何原因召回的车中发现丢失CAN数据的记录有292宗。毛刺是引起CAN总线出错的可能原因,其具体诱发过程需要仔细分析,不能掉以轻心。

2 CAN位时间与消息仲裁原理

CAN总线把位时间划分为NBT等分的时间片,称为Tq。CAN总线控制器按Tq对总线上的差分电平进行采样,以决定内部状态。当总线上没有通信时,称为总线空闲,电平差在0~0.5 V,逻辑值为“1”。电平差为0.9 V以上时逻辑值为“0”。 由图1可知,存在“0“毛刺,也存在“1“毛刺。CAN总线驱动器的特性是线与,当“1”和“0”同时发生时,总线的电平为“0”,这便是仲裁功能。一帧开始发送的第一位是“0“,称为SOF,然后是消息的标识符ID。ID代表了消息的优先级,每个节点通过位采样知道总线上仲裁的结果,正常工作时如果发送“1”而读回“0”,表示本发送节点本次ID发送失败,需等下一次帧发送机会。

总线空闲时,一个有发送要求的节点须先观察是否有别的节点已经开始发送,如已开始就不能发送。正是这里,由一个“0”毛刺开始的时段可以误解为别的节点已开始传送SOF,毛刺阻断了该节点的发送(不管该节点要传送的消息优先级有多高)。

由于传送电缆延迟以及中间器件(如光隔离)的延迟τ,节点将见不到提前量τ以内发送的别的节点的SOF。同理,别的节点要经过τ以后才见到该节点发送的SOF,τ以后别的节点就因总线上已有发送而不允许发送了。这样,在本节点请求时刻±τ内的发送被认为是“同时”请求发送,它们将按ID仲裁。对迟于其τ的其他低优先级帧的发送,它也是必然胜出的。

3 CAN位时间同步的有关规定

CAN的位时间分为同步段(Sync)、传输段(Tprop)、缓冲1段(Ph1)与缓冲2段(Ph2),位值采样在Ph1 与Ph2之间。位值变化时将有跳变沿,只有1/0为同步用的跳变沿。跳变沿决定了相位差e,跳变沿在Ph2内e为负,在Sync内为0,在Tprop和Ph1内为正。每个节点根据e实行同步,同步的修正量受同步的种类限制。同步分两种:硬同步与重同步。硬同步对应帧开始时的情况,重同步对应帧内有同步沿时的情况。对重同步而言,每次的修正量不能大于称为重同步宽度的可预先设定的量SJW,SJW=min(Ph1,Ph2)。

有关本文讨论内容的CAN总线标准为ISO 118981(2003)[9]及ISO 16845(2004)[10],正是这些条款的规定保证了CAN总线协议在高度干扰的环境下能可靠工作。

ISO 118981第10.4.2.2款规定,节点只有在总线空闲时可以发SOF,在服务间隔第3位(I.M.3)的“0”视为SOF。

ISO 118981第12.4.2.1款规定硬同步在帧间的间隔中实行。而帧间间隔包括服务间隔和总线空闲,对上次发送的消极报错节点还包括禁发时间。因此,在I.M.3的跳变沿也是作硬同步用的。

ISO 118981第12.4.2.4款规定,重同步的目的是校正采样点的位置,e为“+”时延长Ph1,e为“-”时缩短Ph2。校正量在e小于或等于SJW时为e,反之为SJW。

ISO 16845第7.7.2款规定了接收节点对SOF的硬同步验证方法意味着同步段SYNC直接同步于1/0跳变沿。

ISO 16845第8.7.2.1款规定了发送节点在I.M.3位值采样点前有1/0沿时的硬同步验证方法:测试设备在被测单元I.M.3采样点前Tq加被测单元内部处理时间前发0,要求被测单元在跳变沿1位后发ID最高位。这意味着发送节点要与I.M.3内1/0跳变沿硬同步,0值被采样,下一位不再发SOF而是发ID最高位。

ISO 16845第8.7.3.1款规定了发送节点在I.M.3位值采样点后有1/0沿时的硬同步验证方法:测试设备在被测单元I.M.3采样点后1个被测单元内部处理时间后发0,要求被测单元在跳变沿后1 Tq立即发SOF。这意味着发送节点是硬同步,但开始发SOF。

ISO 118981第4.18和4.16款规定了发送节点和接收节点的定义。发送节点指的是发数据帧或远程帧的节点,其状态维持到仲裁失败退出或总线再度空闲,否则就是接收节点。因此总线空闲时遇到毛刺,则大家都是接收节点。

ISO 16845第7.7.9款规定了接收节点在总线空闲时对毛刺滤除的验证方法:要确定对总线空闲时短于Tprop+Ph1-1的0不作SOF处理。也就是说硬同步后未被采样到就不算作SOF。

4 毛刺造成优先级倒置

4.1 总线空闲时毛刺引起的倒置

总线空闲时,局部错的0毛刺被Tq采样到,发送节点就会按ISO 16845 7.7.2规定实行硬同步,然后就要按ISO 16845 7.7.9款确定是别的节点发送的SOF还是毛刺。如果节点H在毛刺后Tq有发送请求ReqH(如图2所示),它也必须等待Tprop+Ph1以确定总线是否空闲。另一个节点L如有发送ReqL,其到H的传送延迟为τ,只要它能在H的硬同步后的采样点采到,H就不再有发送机会。此时H、L请求的时间差为Tprop+Ph1-τ。如果2个节点靠得很近,τ≈0,那么H甚至无法与比它迟Tprop+Ph1的L竞争。同时它也无法与比它早τ-1的其他节点的发送相竞争。针对第1节中所讲的“同时”情况,它已完全无法参与竞争。

 

图2 总线空闲时毛刺引起优先级倒置

继续阅读
基于DSP的电动汽车监控平台系统技术原理

1 前言 电动汽车中的电控单元多、内部空间小、环境干扰大,对控制系统、通信系统提出了更高的要求。CAN 以其良好的运行特性,极高的可靠性和独特的设计,特别适合电动汽车各电子控制单元之间的通信。为了更

CAN总线如何抗干扰?遵守六条“军规”肯定没错!

随着CAN总线在电动汽车、充电桩、电力电子、轨道交通等电磁环境比较恶劣的场合应用越来越多,信号干扰的问题已经严重影响到使用者对CAN总线的信任。究竟如何才能抗干扰?本文展示了致远电子CAN总线抗干扰的6条“军规”。

CAN BUS特色与应用实例

由于汽车产业不断追求安全可靠、极致性能、舒适方便以及低成本等目标,但汽车内高复杂的系统网络,使得线束过于庞大,导致成本提高且网络架构也难以持续提升,与前者形成冲突。 于是德国Bosch在1985年提

如何让你的CAN更加安全?办法在这里!

每辆汽车中都使用CAN网络来连接电子控制单元(ECU),预计未来十年它仍会是主导性网络。随着汽车电子设备不断增多,跨CAN网络交换的实时数据量也在增加。

如何进行CAN总线故障定位及干扰排除?

目前,国内机动车保有量已经突破三亿大关。由于大量的燃油车带来严峻的环境问题,因此全面禁售燃油车的日程在全世界范围内被提起。