自动驾驶路径跟踪控制——驾驶员预瞄模型

发布于:2024-02-09 01:04:02

文章目录

1. 驾驶员预瞄控制概述

    近年来随着智能汽车的发展,出现了很多关于汽车运动的控制算法,包括方向控制算法、速度控制算法以及方向与速度综合控制算法。
    虽然这些算法大多不以驾驶员模型命名,但实质上它们无一例外地描述了驾驶员对汽车运动的某种控制行为,从广义上来说这些控制算法从属于驾驶员模型

1.1 第一个得到应用的驾驶员模型(Crossover模型)

    国际上最早得到应用的驾驶员模型大概是McTure等人提出的Crossover模型,这是一种补偿跟踪模型。其系统框图如图所示,其中H(s)表示驾驶员的控制特性,G(s)表示汽车的动力学特性。Crossover 模型特点
     具有结构简单并且参数可以通过理论方法确定的优点。
Crossover 模型应用
     应用于预测人-车闭环系统抵抗侧风等外界干扰的稳定性相关研究。

1.2 预瞄概念的诞生

     Kondo提出了线性预估模型。该模型规定驾驶员总是提前一段距离 L p {L_p} Lp预瞄预期轨迹,并假定无转向盘输入时汽车将沿当前车体坐标系的纵轴 X V {X_V} XV 方向行驶,而驾驶员对方向盘的理想操作量与预期轨迹点在车体坐标系下的横向位移偏差 ε \varepsilon ε 成正比线性预估模型特点
     虽然该模型在预估环节存在较大偏差,模型参数也无法通过理论方法确定,但该模型描述了驾驶员的前视特点,比补偿跟踪模型更符合真实驾驶员的行为特性.
线性预估模型意义
     预瞄的概念由此诞生,并对后来驾驶员模型的发展产生了深远的影响

1.3 驾驶员模型环节

    按照车辆的运动特性,轨迹跟踪可分为纵向跟踪横向跟踪。想要实现一个优秀的路径跟踪一个很重要的办法就是使车辆如同被优秀的驾驶员控制一般运行。(Apollo的控制策略为纵向PID,横向LQR)
    因为一个算法是否足够优越最后也是由人来评价的,车辆是否偏离路径,是否可以抵抗干扰,是否可以应对突发情况都是一个优秀的驾驶员应该做到的。
    因此研究驾驶员模型也是研究路径跟踪的核心问题之一,同时也在同时在“人一车一路”闭环系统研究中发挥重要作用。
    与室内机器人的一般控制方法(需要得到实时的状态信息予以控制)不同,汽车通常是高速运动的。汽车的高速运动特性也决定了控制汽车运动的频率比较低,否则容易导致震荡。
    根据驾驶员的前视作用,真实驾驶员的驾驶活动可假想得划分为三个环节: 信息感知环节、轨迹决策环节和校正操作环节
    通过建立精准的驾驶员模型,提高自动驾驶汽车对道路自适应性以及高速工况下控制精度和平顺性,成为现阶段自动驾驶汽车轨迹跟踪的关键。

ps:现在的驾驶员模型主要着手于执行决策与操作矫正


    早期研究最多的便是驾驶员横向控制模型,因为相对于纵向跟踪控制而言,横向跟踪控制的发展相对较为不成熟
    因为车辆是一个非线性系统,存在强耦合、参数不确定性等控制难题。因此,对于车辆这样复杂的系统,横向路径跟踪控制一直是汽车控制领域的研究热点
    自上世纪中期以来各国学者便提出了许多基于汽车方向控制的驾驶员模型,其中可以分为补偿跟踪模型与预瞄跟踪模型

1.4 补偿跟踪模型

    补偿跟踪模型提出时间最早,其代表为PID模型与Crossover模型。
    驾驶员补偿跟踪模型输入为当前时刻预期轨迹的信息(一般为侧向偏差)和汽车行驶的状态信息(一般为汽车的侧向位置)之间的偏差输出为方向盘转角
    但会导致方向盘操控频繁,引起震荡(控制频率太高),且不适用于高速行驶时的预瞄跟踪运动。

1.5 预瞄跟踪模型

    预瞄跟踪模型通过输入道路路径,在车辆前方设置预瞄点模拟驾驶员开车视线情况分析预瞄点与路径的相对状态,结合车辆目前的行驶姿态,从而输出方向盘转角
    其中 f f f代表输入的预期轨迹, f e {f_e} fe表示预瞄环节估计的汽车未来时刻的位置状态 ε \varepsilon ε表示估计值偏差 δ \delta δ表示输入汽车的方向盘转角, y y y表示实际输出车辆轨迹, P ( S ) P(S) P(S) F ( S ) F(S) F(S) B ( S ) B(S) B(S)分别代表预瞄环节,前向校正环节与反馈估计环节。

1.6 速度控制模型

    速度控制模型通常用于巡航控制研究中,下面就介绍几个速度控制驾驶员模型。

1.6.1 速度控制的驾驶员模型

    日本学者K.Yoshimoto提出了一个速度控制的驾驶员模型。
    该模型以当前汽车和前方障碍的相对距离和此刻驾驶员所感知的汽车纵向加速度为基础,经过一个匀减速过程,来预测汽车在停止前和前面障碍之间的距离
    驾驶员设定一个汽车和前方障碍之间的安全距离,然后驾驶员根据此安全距离和上面得到的预测距离之间的差值来决定制动踏板的控制命令

1.6.2 驾驶员最优预瞄纵向加速度模型

    吉林大学高振海等人基于预瞄跟随理论和模糊决策理论建立了一种驾驶员最优预瞄纵向加速度模型。

    模型中考虑了驾驶员滞后特性和汽车动力学系统非线性特性的因素,并通过控制油门和制动踏板来控制汽车车速变化,能够较好的反映驾驶员对车速的控制行为。

1.7 总结

    大多数现有模型仍属于跟随既定轨迹或既定速度曲线的跟随控制模型,只有少数模型具有实时决策预期轨迹的功能
    根据决策时所采用的优化变量不同,具有轨迹决策功能的模型又可分为两种,其中,大多数模型直接以驾驶操作量作为优化变量,而最优预瞄加速度模型与其他模型不同,优化变量采用中间变量——预瞄加速度

2. 驾驶员模型

2.1 预瞄策略(单点预瞄和区段预瞄)

     一般来说,预瞄策略取决于预瞄时间的长度,以及预瞄窗的宽度和形式,随着预瞄窗宽度和形式的变化,可以衍生出多种不同的预瞄策略。     研究经验表明,就预瞄策略对人-车闭环系统跟随性能的影响而言,预瞄时间是主要因素,而预瞄窗的宽度和形式只是次要因素。而且,单点预瞄时的跟随性能通常比区段预瞄时更好。(区段预瞄有可能会产生积分抵消,无法正确作出判断)。

2.2 预瞄最优曲率模型(位置预瞄模型)

    在车速很低的情况下几乎不涉及汽车的动态响应问题,汽车的运动简单的服从于“阿克曼几何关系”即汽车轨迹曲率与方向盘转角成正比类似于上一讲中的纯追踪模型)。
    依据此关系,可以列出下式: 1 R = δ S W i L \frac{1}{R} = \frac{{{\delta _{SW}}}}{{iL}} R1=iLδSW y ¨ = v 2 R = δ S W ⋅ v 2 i L \ddot y = \frac{{{v^2}}}{R} = \frac{{{\delta _{SW}} \cdot {v^2}}}{{iL}} y¨=Rv2=iLδSWv2式中: δ S W {{\delta _{SW}}} δSW——方向盘转角
       L L L——轴距
       y y y——汽车的横向位置
       y ¨ {\ddot y} y¨——汽车的横向加速度(向心加速度)
       v v v——车速
       i i i——转向系传动比
       R R R——汽车转弯半径
    我们考虑汽车在一个预定的路线上行驶,轨道中心的方程为 f ( t ) f(t) f(t),设在 t 0 t_0 t0时刻,汽车的状态为 y = y ( t 0 ) y = y(t_0) y=y(t0) & & {\rm{\& \& }} && y ˙ = y ˙ ( t 0 ) \dot y = \dot y(t_0) y˙=y˙(t0) [在程序中,一般以差分的形式代替微分 f ( t + Δ t ) − f ( t ) Δ t \frac{{f(t + \Delta t) - f(t)}}{{\Delta t}} Δtf(t+Δt)f(t)] 驾驶员向前预视一个距离 d d d,相应的可以算出前视时间为 T = d v T{\rm{ = }}\frac{d}{v} T=vd ,驾驶员前视点的坐标为 f ( t 0 + T ) f(t_0+T) f(t0+T),此时选择一个方向盘角度 δ S W {{\delta _{SW}}} δSW ,对应着汽车的轨迹曲率为 1 R \frac{1}{R} R1 ,横向加速度为 y ¨ ( t ) \ddot y(t) y¨(t) ,这样经过时间 T T T之后,在 t 0 + T t_0+T t0+T处的位置为 y ( t 0 + T ) y({t_0} + T) y(t0+T),对其在 t = t 0 t=t_0 t=t0处泰勒展开,取前三项,得: y ( t 0 + T ) = y ( t 0 ) + T y ˙ ( t 0 ) + T 2 2 y ¨ ( t 0 ) y({t_0} + T) = y({t_0}) + T\dot y({t_0}) + \frac{{{T^2}}}{2}\ddot y({t_0}) y(t0+T)=y(t0)+Ty˙(t0)+2T2y¨(t0)

ps:图中的y(t)应为y(t0),t+T应为t0+T,且该图忽略了泰勒展开的二阶项

    在此例中,我们先假设驾驶员的目光集中于前方一点处,即为单点预瞄
    根据“最小误差原则”,驾驶员总是希望选择一个最优的轨迹曲率 1 / R 1/R 1/R,使得汽车走过距离 d d d之后,其横向位置 y ( t 0 + T ) y(t_0+T) y(t0+T)与预期的轨道坐标 f ( t 0 + T ) f(t_0+T) f(t0+T)一致。
    联立下式, y ( t 0 + T ) = y ( t 0 ) + T y ˙ ( t 0 ) + T 2 2 y ¨ ( t 0 ) y ¨ ( t ) = v 2 R d = v T f ( t 0 + T ) = y ( t 0 + T ) \begin{array}{c}y({t_0} + T) = y({t_0}) + T\dot y({t_0}) + \frac{{{T^2}}}{2}\ddot y({t_0})\\\ddot y(t) = \frac{{{v^2}}}{R}\\d = vT\\f({t_0} + T) = y({t_0} + T)\end{array} y(t0+T)=y(t0)+Ty˙(t0)+2T2y¨(t0)y¨(t)=Rv2d=vTf(t0+T)=y(t0+T)    得最优的轨迹曲率 1 / R 1/R 1/R 1 R = 2 d 2 [ f ( t 0 + T ) − y ( t 0 ) − T y ˙ ( t 0 ) ] \frac{1}{R} = \frac{2}{{{d^2}}}\left[ {f({t_0} + T) - y({t_0}) - T\dot y({t_0})} \right] R1=d22[f(t0+T)y(t0)Ty˙(t0)]    或最优加速度为:
y ¨ ( t 0 ) = 2 T 2 [ f ( t 0 + T ) − y ( t 0 ) − T y ˙ ( t 0 ) ] \ddot y({t_0}) = \frac{2}{{{T^2}}}\left[ {f({t_0} + T) - y({t_0}) - T\dot y({t_0})} \right] y¨(t0)=T22[f(t0+T)y(t0)Ty˙(t0)]    由式子:
1 R = δ S W i L \frac{1}{R} = \frac{{{\delta _{SW}}}}{{iL}} R1=iLδSW y ¨ = v 2 R = δ S W ⋅ v 2 i L \ddot y = \frac{{{v^2}}}{R} = \frac{{{\delta _{SW}} \cdot {v^2}}}{{iL}} y¨=Rv2=iLδSWv2    得最优转角关系 δ S W = 2 i L d 2 [ f ( t 0 + T ) − y ( t 0 ) − T y ˙ ( t 0 ) ] {\delta _{SW}} = \frac{{2iL}}{{{d^2}}}\left[ {f({t_0} + T) - y({t_0}) - T\dot y({t_0})} \right] δSW=d22iL[f(t0+T)y(t0)Ty˙(t0)]

2.3 最优预瞄侧向加速度模型

2.3.1 最优预瞄侧向加速度决策假说

    最优预瞄侧向加速度决策假说,将驾驶员控制汽车行驶的行为划分成以下两个阶段:
    首先,根据前方预期轨迹当前时刻的汽车运动状态,通过某种预瞄策略决策得到一个最优预瞄侧向加速度
    然后,对汽车的侧向动力学特性以及驾驶员本身的反应延迟和动作之后滞后特性进行校正,得到一个最优的转向盘操作指令
     随着时间推移不断重复上述预瞄和校正过程,便可控制汽车跟随驾驶与预期的轨迹行驶,体现了预测控制理论的滚动优化思想
     在实际的驾驶过程中,驾驶员观测前方道路的视角,总是随着汽车运动而不断发生变化。
    因此,在对驾驶员控制行为进行建模时,预瞄坐标系 x − o − y x-o-y xoy方向要始终与车体坐标系 x v − o v − y v xv-ov-yv xvovyv 保持一致
     在未来一段时间内,如果保持侧向加速度为 0,则汽车将沿当前时刻的速度方向做直线运动;
     如果驾驶员通过预瞄提前判断出汽车沿该直线方向运动一段时间之后将会偏离预期轨迹,那么他(或她)就会期望汽车能够产生一定的侧向加速度以弥补这种偏差该侧向加速度即为最优预瞄侧向加速度

2.3.2 最优预瞄侧向加速度决策算法

     T P {T_P} TP为预瞄时间, x ( t ) x(t) x(t) y ( t ) y(t) y(t) 分别为当前时刻汽车质心位置在预瞄坐标系中的 x x x 坐标和 y y y 坐标; f ( t ) f(t) f(t)为当前时刻汽车质心位置对应预期轨迹的 y y y 坐标; V V V 为当前时刻的汽车运动速度矢量; x ˙ ( t ) {\dot x(t)} x˙(t) y ˙ ( t ) {\dot y(t)} y˙(t)分别为 V V V x x x 方向上的分量和 y y y 方向上的分量; f ( t + T p ) f(t+{T_p}) f(t+Tp) 为驾驶员所预期的在未来 t + T p t+{T_p} t+Tp时刻汽车质心到达位置的 y y y 坐标,该位置是前方预期轨迹上的一点; y ¨ ( t ) {\ddot y(t)} y¨(t) 即为最优预瞄侧向加速度。

2.3.3 位置加方位预瞄模型

     在决策最优预瞄侧向加速度时,假定了侧向加速度在整个预瞄时间段内保持不变,即按照时间 t t t 的二次函数来预测汽车的未来行驶轨迹 y ( t + T p ) = y ( t ) + T p y ˙ ( t ) + T p 2 2 y ¨ ( t ) y(t + {T_p}) = y({t}) + {T_p}\dot y(t) + \frac{{{T_p}^2}}{2}\ddot y({t}) y(t+Tp)=y(t)+Tpy˙(t)+2Tp2y¨(t)      如果驾驶员期望未来到达位置的 y y y坐标为 f ( t + T p ) f(t+{T_p}) f(t+Tp) ,根据上式,则最优预瞄侧向加速度可由下式求得: f ( t + T p ) = y ( t ) + T p y ˙ ( t ) + T p 2 2 y ¨ ( t ) f(t + {T_p}) = y({t}) + {T_p}\dot y(t) + \frac{{{T_p}^2}}{2}\ddot y({t}) f(t+Tp)=y(t)+Tpy˙(t)+2Tp2y¨(t)    在上式中,只有 y ¨ ( t ) {\ddot y(t)} y¨(t) 一个未知数,因此由上式假设求得的最优预瞄侧向加速度能满足上式所设的位置条件而无法兼顾汽车行驶轨迹与驾驶员预期轨迹方位的一致性
     若要在满足位置条件的同时兼顾方位的一致性,则至少要按照时间 t t t 的三次函数来预测汽车的未来行驶轨迹: y ( t + T p ) = y ( t ) + T p y ˙ ( t ) + T p 2 2 y ¨ ( t ) + λ T p 3 6 y ( 3 ) ( t ) y(t + {T_p}) = y(t) + {T_p}\dot y(t) + \frac{{{T_p}^2}}{2}\ddot y(t) + \frac{{\lambda {T_p}^3}}{6}{y^{(3)}}(t) y(t+Tp)=y(t)+Tpy˙(t)+2Tp2y¨(t)+6λTp3y(3)(t)     式中, λ λ λ 为方位作用系数,用于松弛驾驶员对方位跟随的要求,在[0,1]取值。
    对上式求导,丢掉四阶项,可得:     y ˙ ( t + T p ) = y ˙ ( t ) + T p y ¨ ( t ) + T p 2 2 y ( 3 ) ( t ) \dot y(t + {T_p}) = \dot y(t) + {T_p}\ddot y(t) + \frac{{{T_p}^2}}{2}{y^{(3)}}(t) y˙(t+Tp)=y˙(t)+Tpy¨(t)+2Tp2y(3)(t)    同时满足位置条件和方位条件的 y ¨ ( t ) \ddot y(t) y¨(t) y ( 3 ) ( t ) {y^{(3)}}(t) y(3)(t) ,可由以下两式求得 f ( t + T p ) = y ( t ) + T p y ˙ ( t ) + T p 2 2 y ¨ ( t ) + λ T p 3 6 y ( 3 ) ( t ) f(t + {T_p}) = y(t) + {T_p}\dot y(t) + \frac{{{T_p}^2}}{2}\ddot y(t) + \frac{{\lambda {T_p}^3}}{6}{y^{(3)}}(t) f(t+Tp)=y(t)+Tpy˙(t)+2Tp2y¨(t)+6λTp3y(3)(t) f ˙ ( t + T p ) = y ˙ ( t ) + T p y ¨ ( t ) + T p 2 2 y ( 3 ) ( t ) \dot f(t + {T_p}) = \dot y(t) + {T_p}\ddot y(t) + \frac{{{T_p}^2}}{2}{y^{(3)}}(t) f˙(t+Tp)=y˙(t)+Tpy¨(t)+2Tp2y(3)(t)    式中, f ˙ ( t + T p ) \dot f(t+{T_p}) f˙(t+Tp)代表了预期轨迹的方位信息(预期轨迹曲线的斜率)。
    由上述两式消去 y ( 3 ) ( t ) {y^{(3)}}(t) y(3)(t) ,可得: f ( t + T p ) − λ T p 3 f ˙ ( t + T p ) = y ( t ) + ( 1 − λ 3 ) T p y ˙ ( t ) + ( 1 2 − λ 3 ) T p 2 y ¨ ( t ) f(t + {T_p}) - \frac{{\lambda {T_p}}}{3}\dot f(t + {T_p}) = y(t) + (1 - \frac{\lambda }{3}){T_p}\dot y(t) + (\frac{1}{2} - \frac{\lambda }{3}){T_p}^2\ddot y(t) f(t+Tp)3λTpf˙(t+Tp)=y(t)+(13λ)Tpy˙(t)+(213λ)Tp2y¨(t)    顾及上式,同时由位置条件和方位条件求解 y ¨ ( t ) \ddot y(t) y¨(t) 的过程,称为位置加方位预瞄的最优预瞄侧向加速度策略
    研究经验表明,通过适当设置方位作用系数 λ λ λ P O PO PO 预瞄模型不仅可以有效提高人-车闭环系统的跟随性能,而且描述了位置预瞄模型无法描述的如下实际现象:
    在汽车进入弯道之前,为顺利通过弯道,驾驶员通常会先向反方向转动转向盘。
    综上所述, P O PO PO 预瞄模型在位置预瞄模型基础上兼顾了汽车行驶轨迹与驾驶员预期轨迹方位的一致性,是一种更为完善的驾驶员方向控制模型。

2.3.4 方向与速度综合控制的驾驶员模型

    它与方向控制模型相比具有两个显著特点:

  • 根据当前汽车运动状态和交通环境信息实时决策预期轨迹
  • 对汽车行驶的方向与速度进行综合控制

    方向与速度综合控制模型,将驾驶员对汽车运动的控制行为划分成信息感知预瞄决策校正操作三个部分。

3. 双点预描控制模型

3.1 驾驶员视觉注意机制

    人类生理、心理学家Land和Horwood于1994年对人类驾驶员在弯道行驶时的行为进行研究。
    研究发现,在驾驶车辆时大部分驾驶员的视觉范围都局限在很小的范围内,驾驶员注意的范围主要包括“远”“近”两个区域。     远近预瞄点代表着两个预瞄距离不同的预瞄点,也就是预瞄时间较长与较短的两个点
    郭孔辉院士已经验证较长的预瞄时间可以使驾驶过程更加平稳,方向盘的摆动幅度较小,但车辆会与期望路径产生较大偏差
    采用较小的预瞄时间则可以提高车辆与期望路径的追随性能,但会使方向盘的转动更加剧烈,使车体产生震荡,相比较长的预瞄时间更容易出现失稳现象。所以选择较远点与选择较近点都不是最理想的选择。
    因此前方道路整体信息是很关键的信息,而不能局限于一点上,对此郭孔辉院士提出了 τ 2 {\tau ^2} τ2预瞄窗的概念。
     τ 2 {\tau ^2} τ2预瞄窗的概念,即将前方预瞄距离从 d 1 d_1 d1 d 2 d_2 d2一段道路的横向偏差进行积分,将积分结果作为输入

    这种输入可以将一段道路的信息纳入考虑,既考虑了远点信息,又兼顾了近点信息,但却可能出现‘信息混淆’的现象。
    对于下图两种不同情况,可是驾驶员得到的道路输入值完全相同,导致不正确的输出。

资讯 观察行业视觉,用专业的角度,讲出你们的心声。
MORE

I NEED TO BUILD WEBSITE

我需要建站

*请认真填写需求信息,我们会在24小时内与您取得联系。