环形燃烧室周向点火机理基础研究进展

王高峰; 夏一帆; 叶沉然; 胡科琪; 令狐昌鸿

doi:10.11729/syltlx20180090

环形燃烧室周向点火机理基础研究进展

浙江大学航空航天学院, 杭州 310000

基金项目:

燃烧室/涡轮耦合计算及其在热斑机理研究中的应用项目 91541108

详细信息

作者简介:
王高峰(1979-), 男, 副教授, 博士.研究方向:燃烧室和涡轮耦合作用.通信地址:浙江省杭州区西湖区浙大路38号浙江大学航空航天学院 310000).E-mail:gfwang@zju.edu.cn

通讯作者:
叶沉然, E-mail:yechenran@zju.edu.cn

中图分类号: V231.2;TK16
计量
- 文章访问数: 443
- HTML全文浏览量: 138
- PDF下载量: 54
出版历程
- 收稿日期: 2018-06-04
- 修回日期: 2018-09-25
- 刊出日期: 2019-02-24

Progress on light-round ignition dynamics in annular combustor

School of Aeronautics and Astronautics, Zhejiang University, Hangzhou 310027, China

摘要

摘要: 先进航空发动机普遍采用环形燃烧室结构，其周向点火联焰机理对发动机点火可靠性具有重要研究价值。由于实验室尺度模型实验成本低、测量精度高，已经逐渐成为实验研究环形燃烧室点火机理的重要途径。本文介绍了国内外几种典型的实验室尺度环形燃烧室模型及其相关研究，包括法国巴黎中央理工大学EM2C实验室的MICCA燃烧室模型；剑桥大学的预混/非预混环形燃烧室模型；慕尼黑工业大学的缩比燃气轮机环形燃烧室模型；浙江大学的环形燃烧室和涡轮耦合的TurboCombo模型。环形燃烧室周向点火过程一般分为3个阶段：（1）初始火核的形成；（2）火核扩张发展，在点火针附近喷嘴处形成单个稳定的旋流火焰；（3）火焰沿周向传播，依次点燃全部喷嘴后稳定燃烧。影响周向点火联焰过程的因素众多，机理复杂，已有的实验和数值计算对当量比、点火模式、热功率、流速、喷嘴间距等因素影响下的点火、熄火、火焰传播模式、周向点火时间等特征规律进行了丰富的研究。近年来，在环形燃烧室模型上也逐渐开展了气液两相喷雾燃烧的相关研究。同时，高时空分辨率的先进激光诊断方法的引入也将进一步推动点火机理的更深入研究。
- 环形燃烧室 /
- 周向点火过程 /
- 实验室模型 /
- 点火机理
Abstract: Annular combustors are generally applied in aero-engines. Study on light-round ignition dynamics of annular combustors is important for ignition reliability. Laboratory-scale mo-dels have become a feasible way to investigate the ignition mechanism of annular combustors due to its low economic cost and high precision. Several typical laboratory-scale annular combustors and related experiments are reviewed, including the annular combustor MICCA from EM2C in France, the premixed or non-premixed annular combustor made by Cambridge University, the annular combustor model referred from an industrial gas turbine in Technical University Munich, and the annular combustor TurboCombo with the coupling of the combustor and the turbine interaction made by Zhejiang University. The ignition process can be generally divided into three phases:(1) the formation of a flame kernel in a flammable mixture around the igniter; (2) the kernel expands and grows to be a swirling flame, which is stabilized and anchored upon the adjacent burner; (3) the propagation of the flame (light-round), which successively igniting all the burners and then reaching to steady state. The factors influencing the light-round process are quite complicated. Previous experimental and numerical investigations focus on the equivalence ratio, ignition mode, thermal power, bulk velocity, spacing between burners and so on, which influence the characteristics of the ignition, flameout, flame propagation mode and light-round time in the annular combustor. Recently, the spray combustion is also studied in the similar models. Meanwhile, the application of advanced laser diagnostics with high resolution would promote the understanding of the light-round mechanism.
- annular combustor /
- light-round process /
- laboratory-model /
- ignition dynamics

HTML全文

0 引　言

人类大脑理解、分类信息并进行学习的过程一直是人们研究的热点。在人工智能（AI）研究领域，创造出一种能够像人类大脑一样自行学习决策的算法是科学家研究的重要目标。追溯到20世纪80年代末，Sutton^[1]提出的强化学习（RL）算法框架给出了可行性答案。在这个框架中，智能体通过与环境进行互动获得奖励来积累经验、自我学习^[2]。

近年来，深度神经网络的兴起给强化学习提供了强大的新工具^[3]。深度学习与强化学习的结合，称为“深度强化学习（DRL）”，其通过深度神经网络对高维状态空间进行特征提取和函数拟合，消除了经典强化学习的主要障碍。当前，DRL在多个领域都展现了前所未有的强大潜力，不但能够进行机器人控制^[4]和自然语言处理^[5]，还在多种游戏（Atari游戏^[6]、Go^[7]、Dota II^[8]、Starcraft II^[9]、Poker^[10]等）中都达到了高手的水平。与此同时，DRL也被应用到工业中，如韦夫（Wayve）公司通过实验^[11]和仿真^[12]来训练自动驾驶汽车，Google使用DRL来控制其数据中心的散热^[13]。

流动分离作为流动控制中的经典问题，一直是学者们研究的热点。对机翼分离流控制技术的研究主要集中在边界层吹吸气控制方面。吹气控制方式主要有直接吹气（含非定常吹气和微量吹气等）控制和前缘缝翼控制2种。Chng等^[14]对Clark-Y翼型进行吹吸气控制，将吹气控制装置设置在翼型前缘附近，沿流向吹气，将吸气控制装置设置在翼型后缘附近，沿流向吸气；实验结果表明，进行吹吸气控制后，翼型的流动分离被抑制，气动特性明显提升。Coiro等^[15]对机翼表面的分离流动采用非定常吹气控制进行研究，将非定常吹气装置安装在机翼上表面的中间部位，总结了无量纲激励频率和动量系数对非定常吹气控制效果的影响，将实验结果与数值模拟结果对比，证明该吹气控制方式具有良好的控制效果。

近年来，深度强化学习也被应用在流动控制领域。Verma等^[16]使用DRL模拟鱼群在复杂流场中的游动，训练出一个“聪明的游泳者”，能通过调整自身位置和身体变形与迎面而来的涡流动量同步，提高游泳效率。东京大学的Shimomura等^[17]在NACA-0015翼型上采用介质阻挡放电（Dielectric Barrier Discharge，DBD）等离子体激励器对翼型进行了闭环分离控制实验，采用DRL算法对激励器的激励频率进行优化选择，证明在不同迎角下使用DRL算法训练的网络可以选择最优频率。Guéniat等^[18]对圆柱绕流控制进行了尝试，在仿真环境下使用RL算法对流动进行控制，实现了减阻的效果。Pivot等^[19]采用计算仿真方法，模拟低雷诺数（Re=200）二维圆柱绕流流场，通过RL算法控制圆柱的自旋转从而抑制尾迹区的流动，达到减阻目的（减阻率约为17%）。Xu等^[20]在圆柱后方上下布置2个相同的小圆柱，在Re=240时使用DRL算法训练网络，通过控制小圆柱的自旋转来抑制尾流的分离。Rabault与Tang等^[21-22]也采用计算仿真方法模拟了低雷诺数下二维圆柱绕流流场，通过在圆柱上下端点处加装射流孔，对圆柱进行零质量射流控制；仿真结果表明，使用DRL算法训练的网络成功地稳定了卡门涡街，且圆柱受到的阻力也降低了约8%。由此可见，深度强化学习正作为一种可行的控制策略，逐渐与流动控制领域的研究相结合。

本研究的目的是设计一种基于深度强化学习算法的闭环控制系统，该系统可以根据流场中的翼型表面压力系数选择合适的前缘吹气量，抑制大迎角下的流动分离，实现非定常吹气，减小系统的吹气量。实验中，NACA0012翼型以固定的迎角放置于流场中，选择深度强化学习中性能优异的TD3（Twin Delayed Deep Deterministic Policy Gradients）算法^[23]作为控制系统的核心驱动，由压力传感器测得的表面压力实时数据以及智能体自身的动作输出作为神经网络的输入数据，通过迭代实验使智能体自我学习抑制流动分离的最佳控制策略。

1 实验方案

1.1 实验设置

实验在南京航空航天大学（NUAA）非定常空气动力学实验室的1 m非定常低噪声低湍流度风洞中进行。风洞为开口风洞，实验段开口为1.5 m（宽）× 1.0 m（高）。实验模型为二维NACA0012翼型，弦长200 mm，展长400 mm，模型上表面布置了6个测压孔，测压孔均匀分布在机翼中部，相邻孔之间的距离为20 mm，与前缘的距离分别为弦长c的20%、30%、40%、50%、80%、90%，如图1所示。实验风速10 m/s，基于弦长定义的雷诺数为1.36×10⁵，机翼迎角16°。射流激励器采用沿翼型上表面均匀吹气的形式，气体从模型侧边通入，经一级缓冲区和二级缓冲区（设2个缓冲区的目的是保证激励器出口气体速度基本一致），从翼型上表面吹出。激励器的位置如图1所示，与前缘的距离为弦长的10%，射流缝高1 mm，射流出口方向与翼型弦线成30°夹角。射流出口速度由电磁比例阀（PVQ系列）进行无级控制，控制频率为100 Hz，出口速度与电磁比例阀控制信号（即电压信号）正相关，范围为0～22 m/s，如图2所示。机翼表面的压力系数由动态压力传感器（MS4515DO系列）通过测压孔测得，采样频率为100 Hz，准确度为±0.25%。本文通过补偿微压计给出9个标准压力点，使用压力传感器进行了7次重复性测试，绝对误差为±0.2 Pa，如图3所示。

图 1 翼型截面

Fig. 1 Airfoil section view

下载: 全尺寸图片幻灯片

图 2 电压与射流出口速度对应关系

Fig. 2 Correspondence between voltage and jet velocity

下载: 全尺寸图片幻灯片

图 3 传感器重复性测试

Fig. 3 Sensor repeatability test

下载: 全尺寸图片幻灯片

1.2 深度强化学习

强化学习通常被定义为在马尔科夫决策链（MDP）下寻找最优策略从而获得最高累积奖励的问题。马尔科夫决策链可以由1个元组$（S，A，{P}_{{{sa}}}，R）$表示，其中S和A分别表示状态空间和动作空间；P_sa为状态转移分布，表示在状态s下采取动作a后转移到新状态s' 的概率分布；R表示在状态s下采取动作a后获得的奖励。

智能体事先不会被告知任何先验知识，必须自己去发现哪些行为可以获得更高的奖励。图4显示了强化学习的基本框架，在每个离散时间步t中，智能体与环境进行交互，智能体获取环境的当前状态$s（s\in S）$，并根据自身的策略${\text{π}}（{\text{π}}:S\to A）$，在给定的动作范围内输出一个动作$a（a\in A）$，之后智能体会获得一个奖励r和环境的新状态$s'（s'\in S）$。智能体获得的总回报为${R}_{t}={\displaystyle\sum }_{i=t}^{M}{\gamma }^{i-t}r（{s}_{i}，{a}_{i}）$。其中，折扣系数$ \mathrm{\gamma }\in[\mathrm{0，1}） $，表示短期奖励的优先级，当γ=0时表示智能体只关注当前时间步获得的奖励；M表示事件结束时的步数。

图 4 强化学习的基本框架

Fig. 4 The basic framework of reinforcement learning

下载: 全尺寸图片幻灯片

强化学习的目的就是要找出最佳的策略π_ϕ，从而最大化长期回报$J（\phi ）={\mathbb{E}}_{{s}_{i}～{p}_{{\text{π}} }，{a}_{i}～{\text{π}} }\left[{R}_{0}\right]$。其中，$\phi $表示策略π的相关参数，$ {p}_{{\text{π}} } $则是MDP中的状态转移分布。因此，学习的目标是找到一组参数（ϕ*）可以使目标函数J（ϕ）最大化。策略梯度法是通过估计${\nabla }_{\phi }J（\phi ）$，然后执行梯度上升算法找到网格参数θ*。$ {\nabla }_{\phi }J（\phi ） $可以估算为：

$$ {\nabla }_{\phi }J（\phi ）={\mathbb{E}}_{{s}_{i}～{p}_{{\text{π}} }}\left[{\nabla }_{a}{Q}^{{{\text{π}}} }（{s}_{t}，{a}_{t}）{|}_{a={\text{π}} （s）}{\nabla }_{\phi}{{{\text{π}}} }_{\phi }（s）\right] $$

(1)

式中，${Q}^{{\text{π}} }（{s}_{t}，{a}_{t}）$表示从$ {s}_{t} $开始行动、遵循策略π做出动作$ {a}_{t} $后获得的预期回报，一般称之为Q函数。与之相关的还有值函数$ {V}^{{\text{π}} }（{s}_{t}） $，表示从$ {s}_{t} $开始、遵循策略π所能获得的预期回报。Q函数与值函数的相关表达式以及它们之间的关系如下：

$$ \left\{\begin{array}{c}{Q}^{{\text{π}} }（{s}_{t}，{a}_{t}）={\mathbb{E}}_{{s}_{i}～{p}_{{\text{π}} }，{a}_{i}～{\text{π}} }\left[{R}_{t}|s，a\right]\\ {V}^{{\text{π}} }（{s}_{t}）={\mathbb{E}}_{{s}_{i}～{p}_{{\text{π}} }}\left[{R}_{t}|s\right]\\ {Q}^{{\text{π}} }（{s}_{t}，{a}_{t}）=r（{s}_{t}，{a}_{t}）+{V}^{{\text{π}} }（{s}_{t+1}）\end{array}\right. $$

(2)

本研究采用的深度强化学习算法为TD3算法。该算法包含了6个深度神经网络（1个Actor网络、2个Critic网络以及各自对应的Target网络）。TD3算法设置2个Critic网络，可有效缓解Q函数值（简称Q值）高估的问题，延迟Actor网络的更新，减少积累误差，从而降低方差。此外，还引入了一种SARSA型正则化技术，通过改变时序差分目标自举出相似的状态动作对。

1.3 基于深度强化学习的控制策略控制

图5为翼型流动分离的闭环控制系统示意图，图中$ {C}_{p} $为压力系数。在实验中，状态空间$ S $分为2种：第1种是翼型上表面距前缘40%、90%弦长位置的压力系数；第2种在第1种的基础上额外增加智能体的动作输出，即将智能体的动作输出也纳入到观测环境中。为了提高智能体的动态性能，智能体的输入不仅包括当前时刻的观测量$ {S}_{t} $，还会往前追加4步，即智能体的实际观测量为$ \{{S}_{t-4}，{S}_{t-3}， {S}_{t-2}，{S}_{t-1}，{S}_{t}\} $。动作空间$ A $为施加在电磁比例阀上的电压，体现为射流出口速度。射流激励器的控制信号为0～5 V，对应的射流出口速度为0～22 m/s；激励器的控制频率为100 Hz。

图 5 闭环控制系统示意图

Fig. 5 Schematics of the closed-loop control system

下载: 全尺寸图片幻灯片

后缘附近的压力系数能够反映流动分离是否被抑制。当气流附着到机翼表面时，由于压力恢复，后缘的压力系数$ {C}_{p} $会接近于零。因此，奖励值$ {R}_{t} $通过机翼后缘处（距前缘90%弦长）给出，奖励函数可设置为2类：

第1类为离散型奖励函数：

$$ {R}_{t}=\left\{\begin{array}{c}1-{C}_{a}{A}_{t}^{2} ，\ \ {C}_{p} > {C}_{p{\rm{0}} }\\ 0-{C}_{a}{A}_{t}^{2} ，\ \ {C}_{p}\leqslant {C}_{p{\rm{0}} }\end{array}\right.$$

(3)

式中，$ {C}_{a} $为惩罚系数，${C}_{p{\rm{0}}}$为函数分段点。依据流动分离是否被抑制，将奖励离散为0和1，同时附加一个额外的惩罚项${C}_{a}{A}_{t}^{2} $，用于惩罚吹气量的大小，输出动作越大，惩罚项会越大。图6显示了迎角16°时，距前缘90%弦长处的压力系数的时间变化图。图中，射流激励器在第4 s时以最大的动作（5 V）启动，压力系数从–0.50增加到–0.05，流动分离被抑制。根据该结果，将${C}_{p{\rm{0 }}}$设定为–0.30，当距前缘90%弦长处压力系数大于–0.30时，可以认为流动分离已经被抑制或者一定程度上被抑制。

图 6 翼型后缘压力系数随时间变化

Fig. 6 Time variation of the pressure coefficient of the airfoil trailing edge

下载: 全尺寸图片幻灯片

第2类为连续型奖励函数：

$$ {R}_{t}=-\left|{C}_{p}-{C}_{p1}\right|-{C}_{a}{A}_{t}^{2} $$

(4)

当后缘处的压力系数$ {C}_{p} $越接近目标压力系数${C}_{p1}$时，智能体得到的奖励值越接近于0；当后缘处的压力系数$ {C}_{p} $越偏离目标压力系数${C}_{p1}$时，智能体会得到一个更大的负值；同时，智能体还附加有吹气的惩罚量。

离散型奖励函数的目标是抑制翼型的流动分离，而连续型奖励函数的目标则是希望对后缘处的压力系数进行精确控制。

图7展示了智能体的简要学习流程，图中L（θ）为网络参数θ的损失函数。每一个完整的时间步包含了控制部分和训练部分。在开始的时间节点上，智能体根据测压孔测量的翼型表面压力系数$ {S}_{t} $和Actor网络给出的电磁比例阀控制信号$ {A}_{t} $来控制翼型前部的射流速度；在结束的时间节点上测得翼型表面压力系数$ {S}_{t+1} $，根据设置的奖励函数返回一个奖励值$ {R}_{t} $；将$ \left\{{S}_{t}，{A}_{t}，{R}_{t}，{S}_{t+1}\right\} $作为一组数据存入经验池B中。训练部分即从经验池中随机选择一批数据用于神经网络的学习，对Actor网络和Critic网络进行参数更新，而Target网络则根据相应网络参数的变化进行平滑更新。

图 7 智能体简要学习流程

Fig. 7 TD3 algorithm learning process

下载: 全尺寸图片幻灯片

2 结果与讨论

在实验中，对于训练的智能体而言，训练前没有获得任何的先验知识，初始化的智能体输出在给定输出范围的中值（2.5 V）附近。实验每一幕为500个时间步，即5 s。每一幕的总奖励值被定义为500个时间步获得的总奖励值。在训练过程中，由于每一次输出动作都会附加一个随机噪声，总奖励值并不能准确地表示智能体的性能，因此在每训练20幕之后增加测试环节。由于奖励函数不同，智能体每一幕获得的总奖励值也不尽相同，因此下文中的总奖励值均经过统一化处理，以离散型奖励、${C}_{a}=0.010$为计算方式。实验探究了观测量改变（2种方式，即仅以翼型表面压力数据作为观测量或将翼型表面压力数据和智能体自身动作一同作为观测量）对智能体性能的影响，获得了离散型奖励和连续型奖励下智能体的训练效果，最后对训练完成的智能体在其他迎角和风速下的控制效果进行了测试。

2.1 奖励值的变化趋势图

图8显示了惩罚系数C_a=0.010时、离散型奖励下测试环节总奖励值随幕数的变化规律。在训练初始阶段，由于初始化的智能体输出动作在2.5 V附近，射流出口气体速度低，不能抑制翼型的流动分离，无法获取流动再附带来的奖励收益，因此智能体更趋向于降低吹气量以减小吹气惩罚，每一幕的总奖励值一直徘徊在0附近。直到某一刻，一个巨大的动作噪声将输出动作带到了5.0 V附近，射流吹气量陡然增大，流动分离被抑制，智能体学到了有益的经验，总奖励值便开始上升，随后稳定在250左右。如图9所示，此时在智能体的控制下，翼型表面靠近后缘处的压力系数在–0.50～0之间波动，输出动作开始周期性变化，但是动作集中在0 V附近，智能体倾向于少吹气。如图8所示，在60幕的时候，智能体达到了当前参数设置下的最佳控制策略，随后奖励值又开始下降。

图 8 测试环节总奖励值随幕数变化

Fig. 8 The total reward value of the test session varies with episodes

下载: 全尺寸图片幻灯片

图 9 第20幕测试下翼型后缘压力系数和输出电压随时间变化

Fig. 9 Time variation of the pressure coefficient of the airfoil trailing edge and the output voltage at twentieth episode

下载: 全尺寸图片幻灯片

2.2 仅观测压力数据的控制结果对比

2.2.1 离散型奖励控制结果

图10展示了仅以翼型表面压力系数为观测量时、在不同惩罚系数下翼型表面后缘处压力系数随时间的变化和智能体输出动作随时间的变化。由于奖励函数不同，相同时序后缘压力系数在不同奖励函数下获得的奖励也有所不同（图中的总奖励值均经过统一化处理）。可以看出：当惩罚系数$ {C}_{a} $=0时，即对智能体的输出动作不存在惩罚时，智能体毫不犹豫地选择了以最大动作5.0 V输出，抑制了流动分离；而相对于定常吹气，周期性的激励肯定是更好的选择，但是当奖励函数中不存在动作的惩罚时，智能体无法学到该控制律。当惩罚系数$ {C}_{a} $升高至0.005时，惩罚项开始对智能体的控制策略产生影响，翼型后缘压力系数稳定在–0.30以上，这表明翼型的流动分离得到抑制，并且动作输出开始周期性波动，波动的区间限制在2.0～5.0 V。当惩罚系数$ {C}_{a} $=0.010时，训练出的智能体达到了最好的性能表现，输出动作从0和5.0 V开始周期性波动，无量纲激励频率F⁺=0.13。将智能体10 s内的动作输出进行加权平均后，吹气量比定常吹气（5.0 V）减少约52%。当惩罚系数增大至0.020时，由于惩罚项的占比过大，智能体难以逃脱低输出带来的低惩罚，陷入局部最优难以跳出，智能体的控制策略更倾向于集中在0 V附近，控制效果不理想。

图 10 不同惩罚系数下翼型后缘压力系数和输出电压随时间变化

Fig. 10 Time variation of airfoil trailing edge pressure coefficient and output voltage with different C_a

下载: 全尺寸图片幻灯片

2.2.2 连续型奖励控制结果

图11展示了将奖励函数设置为连续奖励时、在智能体控制下翼型表面后缘处压力系数随时间的变化和智能体输出动作随时间的变化。将奖励连续化后，数值上与离散型奖励相差了一个数量级，因而也将惩罚系数减小了一个数量级，奖励函数$ {R}_{t}= -\left|{C}_{p}-（-0.20）\right|-0.001{A}_{t}^{2} $。由图可见，连续型奖励设置下的智能体也训练出周期性的激励，但是并不能将后缘处压力系数稳定在目标值–0.20附近，波动范围很大；但是，它也可以将翼型后缘压力系数控制在–0.30以上，只是输出动作在1.6～5.0 V之间波动，总奖励值略低于离散型奖励下的控制策略。

图 11 连续奖励函数下翼型后缘压力系数和输出电压随时间变化

Fig. 11 Time variation of continuous reward function airfoil trailing edge pressure coefficient and output voltage

下载: 全尺寸图片幻灯片

由此可见，不论是离散型奖励，还是连续型奖励，仅以翼型表面压力数据作为观测量，训练出的智能体并不能很好地达到效果。在强化学习中，对算法性能影响较大的因素是决策链的马尔可夫性质。马尔可夫性质表示系统下一个状态只和当前状态有关，而与之前的状态无关。换言之，根据当前的观测量加上动作量就可以完全确定未来状态轨迹的分布。而在真实的动力学系统中，由于存在实验时间延迟以及误差，系统真实状态无法被完全且准确地获取，进而导致决策链的非马尔可夫性质。下面将在观测量中引入智能体以往采取的动作量，进一步增强系统的马尔可夫性质，并对控制结果进行讨论。

2.3 压力数据与控制动作一同作为观测量的控制结果对比

2.3.1 离散型奖励控制结果

将智能体自身的动作输出加入到观测量，即观测量变为0.04 s内翼型表面压力数据以及智能体自身动作输出的时间序列。图12展示了将动作加入观测量后离散奖励函数下不同惩罚系数对智能体最终训练结果的影响。可以发现，当惩罚系数$ {C}_{a} $= 0.010时，智能体表现出了更加严格的周期性控制，控制频率更高，并且压力系数稳定在–0.10以上，与定常吹气（5.0 V）效果基本一致，但吹气量更少，为定常吹气的50%。而当$ {C}_{a} $=0.020时，智能体则表现出了极致的贪婪，在满足$ {C}_{p} $ > –0.30的前提下尽可能地减少吹气，当压力系数开始下降并将降至–0.30时，智能体才会提前进行一次5.0 V的动作输出，将压力系数拉回。图13对2种控制律进行了傅里叶变换，可以发现，当$ {C}_{a} $=0.010时，傅里叶变换后的幅值P只有一个峰值，对应的无量纲激励频率F⁺=0.50，这表明智能体训练出了一种固定单一频率的控制律，这种周期性激励方式是抑制翼型流动分离的一种典型控制律。当$ {C}_{a} $=0.020时，对控制律进行傅里叶变换后，没有确定的主导频率，存在多个频率共同作用。

图 12 离散奖励函数、不同惩罚系数下翼型后缘压力系数和输出电压随时间变化

Fig. 12 Time variation of airfoil trailing edge pressure coefficient and output voltage with different C_a under discrete rewards

下载: 全尺寸图片幻灯片

图 13 不同控制律的傅里叶变换

Fig. 13 Fourier transform of different control laws

下载: 全尺寸图片幻灯片

2.3.2 连续型奖励控制结果

图14展示了将奖励函数设置为连续奖励时，不同目标压力系数$ {C}_{p1} $下智能体控制的翼型表面后缘压力系数随时间的变化和智能体输出动作随时间的变化。可以看出，当$ {C}_{p1}$为−0.10和−0.20时，智能体可以将翼型后缘压力系数稳定地控制在$ {C}_{p1} $附近。当$ {C}_{p1}=-0.10 $时，后缘处（0.9 c）压力系数起初会有一点超调量，随后便稳定在$ -0.10 $附近，上下波动不超过±0.03。当$ {C}_{p1}=-0.20 $时，智能体也可以将后缘处（0.9 c）压力系数控制在$ -0.20 $附近，上下波动在±0.05以内。将2种控制律进行傅里叶变换后（图15）可以发现，两者都有一个主导频率（即F⁺≈0.66），不同的是两者主频的幅值。当$ {C}_{p1}=-0.10 $时，在F⁺=0处幅值P₀=4.0 V，而$ {C}_{p1}=-0.20$时的P₀=3.0 V，说明2种控制律在基准动作上也有所不同。与仅将压力系数作为状态输入相比，加入动作量状态输入后，智能体的性能大大提升，能够根据奖励函数的设置将压力系数稳定在目标值附近。

下载: 全尺寸图片幻灯片

图 14 连续奖励函数下翼型后缘压力系数和输出电压随时间变化

Fig. 14 Time variation of continuous reward function airfoil trailing edge pressure coefficient and output voltage

下载: 全尺寸图片幻灯片

图 15 不同控制律的傅里叶变换

Fig. 15 Fourier transform of different control laws

下载: 全尺寸图片幻灯片

2.3.3 智能体泛化能力测试

图16为智能体在不同迎角与风速条件下的性能表现。智能体是在迎角16°、实验风速10 m/s的状态下进行训练的，目标压力系数$ {C}_{p1} $=–0.20。训练完成后，将迎角调节为15°和17°，或将实验风速调整为8和12 m/s。由图16（a）～（c）可以看出，在改变风速和降低迎角的情况下，智能体可以将翼型后缘压力系数稳定控制在$ {C}_{p1} $附近；相较于训练工况，测试工况压力系数波动较大；不同状态下，输出的控制律也有所不同。由此可见，通过训练的智能体具备良好的泛化能力。但是在增大迎角的情况下（图16（d）），智能体的泛化能力减弱，不能完成后缘压力系数稳定控制的任务。

图 16 不同迎角与风速下翼型后缘压力系数和输出电压随时间变化

Fig. 16 Time variation of airfoil trailing edge pressure coefficient and output voltage under different angles of attack and wind speeds

下载: 全尺寸图片幻灯片

3 结　论

本文将深度强化学习应用在翼型分离流的主动控制实验中，在无需获取翼型模型的情况下，其能够根据奖励函数完成不同的控制任务。实验研究了基于深度强化学习算法的射流激励器在NACA0012翼型上的闭环流动控制，对比了不同状态输入和不同奖励函数对控制效果的影响。结果表明：

1）基于DRL算法的闭环控制系统可以实现大迎角下流动分离的抑制，并且是在没有任何先验知识的情况下完成了控制律的训练。与定常吹气相比，训练出的非定常吹气可以在满足抑制分离的条件下减少50%的吹气量。在训练过程中，DRL算法不仅能训练出典型控制律，还可以发现新的控制方案。

2）奖励函数的设置对于智能体的训练效果有很大的影响。离散型奖励中，惩罚系数的大小直接影响智能体的策略；而采用不同的奖励（离散型和连续型奖励）也会导致控制效果的差异。

3）对于机翼大迎角流动分离这类准周期运动，将动作量加入观测量可以极大地改善智能体性能。加入动作量后，离散型奖励可以训练出更高频率的控制律，此外还可以在满足条件的情况下尽可能地减小吹气量；连续型奖励训练出的智能体可以将后缘压力系数稳定控制在目标值附近，这是开环控制难以做到的。在改变风速和降低迎角的情况下，智能体具有良好的泛化能力。

图 1 多头部直线排列燃烧室模型概念

Fig. 1 Evolvement of the linearly arranged multiple burners

下载: 全尺寸图片幻灯片

图 2 法国鲁昂大学CORIA实验室直线布置多头部实验装置^[10-11]

Fig. 2 The experimental multi-burner setup with linearly arranged multiple injectors installed in Lab CORIA, Universite de Rouen^[10-11]

下载: 全尺寸图片幻灯片

图 3 英国剑桥大学直线布置多头部实验装置^[12](单位: mm)

Fig. 3 The experimental multi-burner setup with linearly arranged multiple injectors installed in University of Cambridge^[12](unit: mm)

下载: 全尺寸图片幻灯片

图 4 日本宇宙航空研究开发机构3头部实验装置^[9]

Fig. 4 Multi sector unit (3 sectors) in JAXA^[9]

下载: 全尺寸图片幻灯片

图 5 多头部扇区燃烧实验装置

Fig. 5 The experimental multi-burner setups with fan-shaped

下载: 全尺寸图片幻灯片

图 6 MICCA环形燃烧室模型示意图^[13](单位: mm)

Fig. 6 Schematic diagram of the experimental setup of MICCA^[13] (unit: mm)

下载: 全尺寸图片幻灯片

图 7 剑桥大学环形燃烧室模型示意图

Fig. 7 Schematic diagram of the experimental setup in University of Cambridge

下载: 全尺寸图片幻灯片

图 8 慕尼黑工业大学环形燃烧室模型^[23]

Fig. 8 Annular combustor model in Technische Universität München^[23]

下载: 全尺寸图片幻灯片

图 9 浙江大学TurboCombo环形燃烧室模型^[26-27]

Fig. 9 Schematic of the TurboCombo annular combustor model in Zhejiang University^[26-27]

下载: 全尺寸图片幻灯片

图 10 环形燃烧室周向点火过程的3个阶段^[13]

Fig. 10 Three phases of the light-round sequence in annular combustor^[13]

下载: 全尺寸图片幻灯片

图 11 环形燃烧室周向点火过程时序图(φ=0.76, U_b=24.5 m/s)^[13]

Fig. 11 Images of light intensity emitted by the flame during ignition of the annular chamber (φ=0.76, U_b=24.5 m/s) ^[13]

下载: 全尺寸图片幻灯片

图 12 周向点火过程亮度积分图(φ=0.76, U_b=24.5 m/s)^[13]

Fig. 12 Integrated light intensity recorded by the camera during ignition (φ=0.76, U_b=24.5 m/s)^[13]

下载: 全尺寸图片幻灯片

图 13 周向点火过程的5个阶段^[16] (左:实验; 中:F-TACLES模型计算结果; 右: TFLES模型计算结果)

Fig. 13 Five instants of an ignition sequence^[16] (left: experimental images, middle: F-TACLES simulations and right: TFLES simulations)

下载: 全尺寸图片幻灯片

图 14 喷嘴间火焰传播过程OH^*发光侧视图(φ=0.70, U_b=10 m/s)^[20]

Fig. 14 Side visualization of evolution of a successful burner-to-burner flame propagation (φ=0.70, U_b=10 m/s)^[20]

下载: 全尺寸图片幻灯片

图 15 周向火焰传播过程时序图(φ=0.70, P=15.5kW)^[26]

Fig. 15 Images of the light-round sequence (φ=0.70, P=15.5kW)^[26]

下载: 全尺寸图片幻灯片

图 16 不同点火位置示意图^[18]

Fig. 16 Different spark positions^[18]

下载: 全尺寸图片幻灯片

图 17 (a) 点火概率 (b) 可燃因子 (c) 归一化的湍流脉动速度 (d) 归一化的轴向速度(φ=0.35, U_b=10 m/s)^[12]

Fig. 17 Measurements: (a) probability of ignition (b) flammability factor (c) normalized fluctuation of the turbulent velocity (d) normalized axial velocity (φ=0.35, U_b=10 m/s)^[12]

下载: 全尺寸图片幻灯片

图 18 点火极限与可燃极限^[19]

Fig. 18 Stability and ignition limits for the 12-burners (a), 15-burners (b) and 18-burners (c) configurations. The one-burner and light-round ignition limits for three configurations are summarized in (d) and (e)^[19]

下载: 全尺寸图片幻灯片

图 19 剑桥大学环形燃烧室示意图(俯视)^[19]

Fig. 19 Overhead schematic of the annular combustor in University of Cambridge^[19]

下载: 全尺寸图片幻灯片

图 20 剑桥大学环形燃烧室模型的周向火焰传播过程(俯视, φ=0.40)^[19]

Fig. 20 Top view of burner-to-burner ignition sequence in the annular combustor in University of Cambridge (φ=0.40)^[19]

下载: 全尺寸图片幻灯片

图 21 剑桥大学环形燃烧室模型头部干涉OH^*基自发光平均场^[41] (a)头部间距是2.33倍喷嘴直径; (b)头部间距是1.56倍喷嘴直径

Fig. 21 Extent of flame interaction in an annular combustor mea-sured via time-average OH^* chemiluminescence from an overhead view with two nozzles pacings: (a) 2.33 and (b) 1.56 times the nozzle diameter^[41]

下载: 全尺寸图片幻灯片

图 22 浙江大学斜喷环流环形燃烧室的周向点火过程^[24](φ=0.75, P=18.6kW)

Fig. 22 Light-round ignition sequences in the oblique-injecting annular combustor in Zhejiang University (φ=0.75, P=18.6kW) ^[24]

下载: 全尺寸图片幻灯片

图 23 喷嘴间距对火焰传播时间的影响^[10]

Fig. 23 Spacing effect of injectors on flame propagation time^[10]

下载: 全尺寸图片幻灯片

图 24 喷嘴间距对火焰在相邻喷嘴间传播所用时间的影响^[11](实验与LES结果)

Fig. 24 Experiments versus LES: spacing effect on the first injector/injector propagation time^[11]

下载: 全尺寸图片幻灯片

图 25 不同条件下周向火焰传播进程随时间发展规律^[20]

Fig. 25 Fraction of annular combustor area ignited vs. time. For each flame, four separate ignition events (fine dotted lines) and their average (thick solid lines) are shown^[20]

下载: 全尺寸图片幻灯片

图 26 火焰面融合所需时间在冷态与预热情况下随流速的变化^[15]

Fig. 26 Flame fronts merging time as a function of the bulk velocity U_b in cold and preheated conditions^[15]

下载: 全尺寸图片幻灯片

图 27 三种不同燃料的周向点火时间^[17]

Fig. 27 Light-round delay τ_l when: (a) the bulk velocity U_b, (b) the equivalence ratio φ kept constant for multiple fuels^[17]

下载: 全尺寸图片幻灯片

图 28 实验和基于G方程数值模拟得到的周向点火时间^[13]

Fig. 28 Total propagation time deduced from experimental results (red) and from simulations based on the G-equation (black) ^[13]

下载: 全尺寸图片幻灯片

图 29 点火模式对周向点火时间的影响^[26]

Fig. 29 Influence of ignition mode on the light-round time^[26]

下载: 全尺寸图片幻灯片

图 30 不同喷嘴结构下周向点火时间t的变化规律(FFSL模式)^[28]

Fig. 30 Time delay t for different injection types (FFSL mode)^[28]

下载: 全尺寸图片幻灯片

图 31 不同喷嘴结构下周向点火时间t的变化规律(SFFL模式)^[24]

Fig. 31 Time delay t for different injection types (SFFL mode)^[24]

下载: 全尺寸图片幻灯片

图 32 不同位置点火器示意图(E:红; I:绿; C:蓝)及对应的火焰面融合时间^[13]

Fig. 32 Schematic top view of the experiment, showing the different igniters locations: E: external (red), I: internal (green), C: central (blue) and its corresponding propagation time^[13]

下载: 全尺寸图片幻灯片

图 33 TurboCombo实验平台上周向点火过程火焰形态^[27]

Fig. 33 Flame visualization in TurboCombo during light-round sequence^[27]

下载: 全尺寸图片幻灯片

图 34 涡轮导叶对周向点火时间的影响^[27]

Fig. 34 The influence of the turbine guide vanes to the light-round time^[27]

下载: 全尺寸图片幻灯片

图 35 火焰积分亮度随时间变化曲线的重复性(φ=0.70, P=15.5kW)^[26]

Fig. 35 The repeatability of temporal evolution of integrated light intensity (φ=0.70, P=15.5kW)^[26]

下载: 全尺寸图片幻灯片

表 1 主流一定, 各燃料在当量比、功率增大时的周向点火时间^[17]

Table 1 Mean light-round time delay τ_l for increasing equivalence ratio and power when bulk velocity is kept constant^[17]

	φ=0.92P=82kW	φ=1.00P=89kW
Propane (gaseous)	23.5ms	21.0ms
n-Heptane (liquid)	29ms (+23%)	25ms (+19%)
Dodecane (liquid)	35.5ms (+51%)	32.0ms (+52%)

下载: 导出CSV

参考文献(41)

[1]	Weigand P, Meier W, Duan X R, et al. Investigations of swirl flames in a gas turbine model combustor[J]. Combustion and Flame, 2006, 144(1-2):205-224. DOI: 10.1016/j.combustflame.2005.07.010
[2]	Palies P, Durox D, Schuller T, et al. Dynamics of premixed confined swirling flames[J]. Comptes Rendus Mécanique, 2009, 337(6-7):395-405. DOI: 10.1016/j.crme.2009.06.001
[3]	Boxx I, Arndt C M, Carter C D, et al. High-speed laser diagnostics for the study of flame dynamics in a lean premixed gas turbine model combustor[J]. Experiments in Fluids, 2010, 52(3):555-567. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=1936ba0f4eea8e498f2dcd45e6ee685b
[4]	Meier W, Boxx I, Stöhr M, et al. Laser-based investigations in gas turbine model combustors[J]. Experiments in Fluids, 2010, 49(4):865-882. DOI: 10.1007/s00348-010-0889-x
[5]	Palies P, Durox D, Schuller T, et al. The combined dynamics of swirler and turbulent premixed swirling flames[J]. Combustion and Flame, 2010, 157(9):1698-1717. DOI: 10.1016/j.combustflame.2010.02.011
[6]	Palies P, Durox D, Schuller T, et al. Nonlinear combustion instability analysis based on the flame describing function applied to turbulent premixed swirling flames[J]. Combustion and Flame, 2011, 158(10):1980-1991. DOI: 10.1016/j.combustflame.2011.02.012
[7]	Boxx I, Carter C D, Stöhr M, et al. Study of the mechanisms for flame stabilization in gas turbine model combustors using kHz laser diagnostics[J]. Experiments in Fluids, 2013, 54(5):1532. DOI: 10.1007/s00348-013-1532-4
[8]	Lacoste D A, Moeck J P, Durox D, et al. Effect of nanosecond repetitively pulsed discharges on the dynamics of a swirl-stabilized lean premixed flame[J]. Journal of Engineering for Gas Turbines and Power, 2013, 135(10):101501. DOI: 10.1115/1.4024961
[9]	Kobayashi M, Ogata H, Oda T, et al. Improvement on ignition performance for a lean staged low NO_x combustor[R]. ASME GT2011-46187, 2011. https://www.researchgate.net/publication/267502943_Improvement_on_Ignition_Performance_for_a_Lean_Staged_Low_NOx_Combustor
[10]	Cordier M, Vandel A, Renou B, et al. Experimental and numerical analysis of an ignition sequence in a multiple-injectors burner[R]. ASME GT2013-94681, 2013.
[11]	Barré D, Esclapez L, Cordier M, et al. Flame propagation in aeronautical swirled multi-burners:experimental and numerical investigation[J]. Combustion and Flame, 2014, 161(9):2387-2405. DOI: 10.1016/j.combustflame.2014.02.006
[12]	Machover E, Mastorakos E. Experimental and numerical investigation on spark ignition of linearly arranged non-premixed swirling burners[J]. Combustion Science and Technology, 2017, 189(8):1326-1353. DOI: 10.1080/00102202.2017.1294589
[13]	Bourgouin J F, Durox D, Schuller T, et al. Ignition dynamics of an annular combustor equipped with multiple swirling injectors[J]. Combustion and Flame, 2013, 160(8):1398-1413. DOI: 10.1016/j.combustflame.2013.02.014
[14]	Philip M, Boileau M, Vicquelin R, et al. Ignition sequence of an annular multi-injector combustor[J]. Physics of Fluids, 2014, 26(9):091106. DOI: 10.1063/1.4893452
[15]	Philip M, Boileau M, Vicquelin R, et al. Simulation of the ignition process in an annular multiple-injector combustor and comparison with experiments[J]. Journal of Engineering for Gas Turbines and Power, 2014, 137(3):031501. DOI: 10.1115/1.4028265
[16]	Philip M, Boileau M, Vicquelin R, et al. Large eddy simulations of the ignition sequence of an annular multiple-injector combustor[J]. Proceedings of the Combustion Institute, 2015, 35(3):3159-3166. DOI: 10.1016/j.proci.2014.07.008
[17]	Prieur K, Durox D, Beaunier J, et al. Ignition dynamics in an annular combustor for liquid spray and premixed gaseous injection[J]. Proceedings of the Combustion Institute, 2017, 36(3):3717-3724. DOI: 10.1016/j.proci.2016.08.008
[18]	Bach E, Kariuki J, Dawson J R, et al. Spark ignition of single bluff-body premixed flames and annular combustors[R]. AIAA-2013-1182, 2013. https://www.researchgate.net/publication/268469348_Spark_ignition_of_single_bluff-body_premixed_flames_and_annular_combustors
[19]	Machover E, Mastorakos E. Spark ignition of annular non-premixed combustors[J]. Experimental Thermal and Fluid Science, 2016, 73:64-70. DOI: 10.1016/j.expthermflusci.2015.09.008
[20]	Machover E, Mastorakos E. Experimental investigation on spark ignition of annular premixed combustors[J]. Combustion and Flame, 2017, 178:148-157. DOI: 10.1016/j.combustflame.2017.01.013
[21]	Pankiewitz C, Sattelmayer T. Time domain simulation of combustion instabilities in annular combustors[R]. ASME GT2002-30063, 2002. https://www.researchgate.net/publication/245353100_Time_Domain_Simulation_of_Combustion_Instabilities_in_Annular_Combustors
[22]	Kunze K, Hirsch C, Sattelmayer T. Transfer function mea-surements on a swirl stabilized premix burner in an annular combustion chamber[R]. ASME GT2004-53106, 2004.
[23]	Fanaca D, Alemela P R, Ettner F, et al. Determination and comparison of the dynamic characteristics of a perfectly premixed flame in both single and annular combustion chambers[R]. ASME GT2008-50781, 2008.
[24]	Ye C R, Wang G F, Fang Y Q, et al. Ignition dynamics in an annular combustor with gyratory flow motion[R]. ASME GT2018-76624, 2018.
[25]	Zhao D M, Lin Q Z, Xia Y F, et al. Simulations of the ignition dynamics in an annular multiple-injector combustor[C]//Proceedings of the CSSCI Spring technical meeting. 2018.
[26]	令狐昌鸿, 王高峰, 钟亮, 等.环形旋流燃烧室模型点火过程的实验[J].航空动力学报, 2018, 33(7):1767-1778. http://d.old.wanfangdata.com.cn/Periodical/hkdlxb201807026 Linghu C H, Wang G F, Zhong L, et al. Experiment on ignition process in annular swirling combustor model[J]. Journal of Aerospace Power, 2018, 33(7):1767-1778. http://d.old.wanfangdata.com.cn/Periodical/hkdlxb201807026
[27]	叶沉然, 王高峰, 方元祺, 等.涡轮导叶对环形燃烧室点火影响的实验研究[C]//2018年中国工程热物理学会燃烧学学术年会论文集. 2018. Ye C R, Wang G F, Fang Y Q, et al. Experimental investigations of ignition dynamics in an annular combustor with turbine guide vanes[C]//Proc of China National Symposium on Combustion. 2018.
[28]	叶沉然, 王高峰, 马承飚, 等.斜喷环流环形燃烧室点火实验研究[J].工程热物理学报, 2018, 39(11):2549-2558. http://www.cnki.com.cn/Article/CJFDTOTAL-GCRB201811032.htm Ye C R, Wang G F, Ma C B, et al. Experimental investigations of ignition process in an annular combustor with circumferential flow via oblique injection[J]. Journal of Engineering Thermophysics, 2018, 39(11):2549-2558. http://www.cnki.com.cn/Article/CJFDTOTAL-GCRB201811032.htm
[29]	Triantafyllidis A, Mastorakos E, Eggels R L G M. Large eddy simulations of forced ignition of a non-premixed bluff-body methane flame with conditional moment closure[J]. Combustion and Flame, 2009, 156(12):2328-2345. DOI: 10.1016/j.combustflame.2009.05.005
[30]	Subramanian V, Domingo P, Vervisch L. Large eddy simulation of forced ignition of an annular bluff-body burner[J]. Combustion and Flame, 2010, 157(3):579-601. DOI: 10.1016/j.combustflame.2009.09.014
[31]	Jones W P, Prasad V N. LES-pdf simulation of a spark ignited turbulent methane jet[J]. Proceedings of the Combustion Institute, 2011, 33(1):1355-1363. DOI: 10.1016/j.proci.2010.06.076
[32]	Gicquel L Y M, Staffelbach G, Poinsot T. Large eddy simulations of gaseous flames in gas turbine combustion chambers[J]. Progress in Energy and Combustion Science, 2012, 38(6):782-817. DOI: 10.1016/j.pecs.2012.04.004
[33]	Jones W P, Marquis A J, Prasad V N. LES of a turbulent premixed swirl burner using the Eulerian stochastic field method[J]. Combustion and Flame, 2012, 159(10):3079-3095. DOI: 10.1016/j.combustflame.2012.04.008
[34]	Bulat G, Jones W P, Marquis A J. Large eddy simulation of an industrial gas-turbine combustion chamber using the sub-grid PDF method[J]. Proceedings of the Combustion Institute, 2013, 34(2):3155-3164. DOI: 10.1016/j.proci.2012.07.031
[35]	Boileau M, Staffelbach G, Cuenot B, et al. LES of an ignition sequence in a gas turbine engine[J]. Combustion and Flame, 2008, 154(1-2):2-22. DOI: 10.1016/j.combustflame.2008.02.006
[36]	Esclapez L, Riber E, Cuenot B. Ignition probability of a partially premixed burner using LES[J]. Proceedings of the Combustion Institute, 2015, 35(3):3133-3141. http://cn.bing.com/academic/profile?id=2fc7361011e41b65d1a7ef2de846ea39&encoded=0&v=paper_preview&mkt=zh-cn
[37]	Neophytou A, Richardson E S, Mastorakos E. Spark ignition of turbulent recirculating non-premixed gas and spray flames:a model for predicting ignition probability[J]. Combustion and Flame, 2012, 159(4):1503-1522. DOI: 10.1016/j.combustflame.2011.12.015
[38]	Fiorina B, Vicquelin R, Auzillon P, et al. A filtered tabulated chemistry model for LES of premixed combustion[J]. Combustion and Flame, 2010, 157(3):465-475. DOI: 10.1016/j.combustflame.2009.09.015
[39]	Auzillon P, Gicquel O, Darabiha N, et al. A filtered tabulated chemistry model for LES of stratified flames[J]. Combustion and Flame, 2012, 159(8):2704-2717. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=ed6fd843a298cf43e57926e1ca87391d
[40]	Colin O, Ducros F, Veynante D, et al. A thickened flame model for large eddy simulations of turbulent premixed combustion[J]. Physics of Fluids, 2000, 12(7):1843-1863. DOI: 10.1063/1.870436
[41]	Worth N A, Dawson J R. Modal dynamics of self-excited azimuthal instabilities in an annular combustion chamber[J]. Combustion and Flame, 2013, 160(11):2476-2489 DOI: 10.1016/j.combustflame.2013.04.031

施引文献(7)

期刊类型引用(3)

1.	陈勇，孔维梁，刘洪. 飞机过冷大水滴结冰气象条件运行设计挑战. 航空学报. 2023(01): 7-21 . 百度学术
2.	唐扬刚，吴敬涛，邓文亮. 过冷大水滴撞击结冰特性实验研究. 低温工程. 2022(04): 42-48 . 百度学术
3.	徐弘，孔维梁，王福新，刘洪. 过冷大水滴相继撞壁对结冰影响的实验研究. 实验流体力学. 2018(02): 28-34 . 本站查看

其他类型引用(4)

资源附件(0)

图(35) / 表(1)

计量

文章访问数: 443
HTML全文浏览量: 138
PDF下载量: 54
被引次数: 7

0 引　言
1 实验方案
1.1 实验设置
1.2 深度强化学习
1.3 基于深度强化学习的控制策略控制
2 结果与讨论
2.1 奖励值的变化趋势图
2.2 仅观测压力数据的控制结果对比
2.2.1 离散型奖励控制结果
2.2.2 连续型奖励控制结果
2.3 压力数据与控制动作一同作为观测量的控制结果对比
2.3.1 离散型奖励控制结果
2.3.2 连续型奖励控制结果
2.3.3 智能体泛化能力测试
3 结　论

0 引　言
1 实验方案
1.1 实验设置
1.2 深度强化学习
1.3 基于深度强化学习的控制策略控制
2 结果与讨论
2.1 奖励值的变化趋势图
2.2 仅观测压力数据的控制结果对比
2.2.1 离散型奖励控制结果
2.2.2 连续型奖励控制结果
2.3 压力数据与控制动作一同作为观测量的控制结果对比
2.3.1 离散型奖励控制结果
2.3.2 连续型奖励控制结果
2.3.3 智能体泛化能力测试
3 结　论

参考文献(41)

施引文献(7)

资源附件(0)

环形燃烧室周向点火机理基础研究进展

作者简介: 王高峰(1979-), 男, 副教授, 博士.研究方向:燃烧室和涡轮耦合作用.通信地址:浙江省杭州区西湖区浙大路38号浙江大学航空航天学院 310000).E-mail:gfwang@zju.edu.cn

通讯作者: 叶沉然, E-mail:yechenran@zju.edu.cn

计量

出版历程

Progress on light-round ignition dynamics in annular combustor

0 引 言

1 实验方案

1.1 实验设置

1.2 深度强化学习

1.3 基于深度强化学习的控制策略控制

2 结果与讨论

2.1 奖励值的变化趋势图

2.2 仅观测压力数据的控制结果对比

2.2.1 离散型奖励控制结果

2.2.2 连续型奖励控制结果

2.3 压力数据与控制动作一同作为观测量的控制结果对比

2.3.1 离散型奖励控制结果

2.3.2 连续型奖励控制结果

2.3.3 智能体泛化能力测试

3 结 论

期刊类型引用(3)

其他类型引用(4)

计量

出版历程

目录

0 引 言

1 实验方案

1.1 实验设置

1.2 深度强化学习

1.3 基于深度强化学习的控制策略控制

2 结果与讨论

2.1 奖励值的变化趋势图

2.2 仅观测压力数据的控制结果对比

2.2.1 离散型奖励控制结果

2.2.2 连续型奖励控制结果

2.3 压力数据与控制动作一同作为观测量的控制结果对比

2.3.1 离散型奖励控制结果

2.3.2 连续型奖励控制结果

2.3.3 智能体泛化能力测试

3 结 论

作者简介:
王高峰(1979-), 男, 副教授, 博士.研究方向:燃烧室和涡轮耦合作用.通信地址:浙江省杭州区西湖区浙大路38号浙江大学航空航天学院 310000).E-mail:gfwang@zju.edu.cn

通讯作者:
叶沉然, E-mail:yechenran@zju.edu.cn

0 引　言

3 结　论

0 引　言

3 结　论