几种神经网络整定PID参数原理剖析及simulink案例仿真_神经网络pid-程序员宅基地

技术标签: 控制  优化算法  人工智能  神经网络  

目录

前言

1  基于单神经元自适应PID Simulink仿真分析

1.1 原理简介

1.1.1 无监督的Hebb学习

​1.1.2 有监督的Delta学习

1.1.3 有监督的Hebb学习

1.1.4 改进的有监督Hebb学习

1.1.5 总结

1.2 simulink仿真分析

1.2.1 将权值作为状态变量仿真分析

1.2.2 利用局部变量定义权值仿真分析

1.2.3 利用延时模块仿真分析

1.2.4 仿真小结

2  基于BP神经网络自适应PID Simulink仿真分析

2.1 原理简介

​​​​2.2 仿真分析

2.2.1 利用局部变量定义权值仿真分析

 ​​​​​​2.2.2 利用延时模块仿真分析

2.1.3 仿真小结

3  基于RBF神经网络自适应PID Simulink仿真分析

3.1 原理简介

3.2 仿真分析

3.2.1 采用局部/全局变量方法

3.2.2 采用延时模块方法

3.2.3 仿真小结

4.学习问题


前言

       其实前面也介绍了整定PID的智能算法,如“优胜劣汰”思想的遗传算法和粒子群算法,这类智能算法的特点是:给定输入,选定目标函数进行不断寻优,最终找到一组最优参数。个人觉得这种算法的弊端在于,虽然能够得到寻得最优解,但是所谓的参数并非“动态”自适应。本篇文章介绍的神经网络自适应的特点是,实时在线进行动态寻优,并且参数是变化的。

       可能这里叙述这么多,初学者觉得还是一头雾水,接下来作者将通过仿真分析,依次介绍单神经元、BP神经网络、RBF神经网络整定PID的方法,其实其他的神经网络或者控制器以及参数都可按照类似思想进行构建。

       网上也有大量类似文章并附有有源程序,但是其实很多都是内容得不到相应结果,或者是纯m语言的仿真,不适合普及仿真分析,所以再思用simulink模型进行仿真分析测试神经网络整定参数的效果。作者也是刚学习完这部分内容,有高见还望读者指出,谢谢理解!

1  基于单神经元自适应PID Simulink仿真分析

1.1 原理简介

单神经元自适应PID原理框架

       上图中:

       ①x1、x2、x3为PID的离散形式变量,这里以增量式PID为例,即x1=e;x2=e-e_1;x3=e-2e_1+e_2。

       ②K为神经原比例系数,K>0,值得说明一下K的选择:K越大,响应越快,单超量增大,甚至可能导致系统不稳定,当系统存在延时环节时,K必须减小以保证系统稳定性。

        单神经元的具有结构简单,且有一点自适应能力的特点,也是神经网络的基本框架衍生,对于初学者学习是很友好的,所以也有典型的几种学习规则,顾名思义,就是权重学习方法进行分支,下面先简单介绍一下:

1.1.1 无监督的Hebb学习

学习规则:

式中:wij为神经元i和神经元j的连接权值,oi和oj表示神经元i、j的激活值,η为学习速率。

无监督的Hebb学习的自适应PID算法:

x1、x2、x3为增量式PID的变量,即:

 

1.1.2 有监督的Delta学习

学习规则:

相比无监督的Hebb学习,其实就是将oj替换成目标输出dj与实际输出oj之差。

有监督的Delta学习自适应PID算法:

注:有监督的Hebb学习规则类似,只不过权值中不包含xi误差变量。 

1.1.3 有监督的Hebb学习

学习规则:

其实就是将无监督的Hebb学习规则和有监督的Delta学习规则结合构成有监督的Hebb学习规则。

有监督的Hebb学习自适应PID算法:

x1、x2、x3为增量式PID的变量,即:

 

1.1.4 改进的有监督Hebb学习

学习规则和有监督的Hebb一样,只不过将权值中的误差变量x替换成e+Δe(k)。

改进的有监督Hebb学习自适应PID算法:

权值中的PID变量xi为:

1.1.5 总结

有点烟花缭乱,但其实就是权值的学习规则差异,再简明点即权值公式小差异,汇总一下 :

1.2 simulink仿真分析

对于simulink这边个人喜欢用s函数去编写模型和控制器,这样更为简介,所以编写程序前先要进行框架构建,考虑一个问题:是否需要状态变量?

个人觉得有3种方法:

①选择wi为离散状态变量;

②不需要状态变量,设定局部或全局状态变量,相当于内部循环;

③不需要状态变量,利用延时模块得到前一时刻的信息进行编写。

结果差异肯定会有一些,但其实过程大同小异!下面我都将进行编写仿真分析,但是由于编写方式不一样,所以参数调节也不一样,故效果仅供参考。

仿真模型:

1.2.1 将权值作为状态变量仿真分析

1.2.2 利用局部变量定义权值仿真分析

1.2.3 利用延时模块仿真分析

1.2.4 仿真小结

①可以看到利用延时模块的搭建控制器参数自适应更为缓和;

②实际中利用状态变量搭建控制器系统更为稳定以及简洁。

2  基于BP神经网络自适应PID Simulink仿真分析

2.1 原理简介

BP神经网络全称是前向传播神经网络,又名反向传播神经网络,一般由3层网络组成:输入层、隐含层(隐层)、输出层。

 BP网络结构

下面分别对基于BP网络与PID结合算法:

①输入层:

其中,j=1,2....M表示输入变量的个数,数量取决于控制系统复杂度。

 ②隐层:

式中,上标(1)、(2)代表输入层、隐层;f为激活函数,可选为sigmoid函数中的tanh(x)

 ③输出层:

既然是输出,那就需要定义何时输出最优值,所以定义性能指标E=e^2.

 式中,由于PID参数一般为非负数,所以激活函数g选取为非负的sigmoid函数:

为输出层惯性项,用于快速收敛得到性能函数极小值:

​​​​​​式中,η为学习速率,α为惯性系数。

由于输入就是选取变量,所以没什么好说的,最终得到隐层和输出层学习算法分别为:

隐层权值学习算法:

 式中,Q为输出层数,这里即优化PID参数,选为3。

:可以看到隐层惯性项中存在δ3,所以算法编写中要先编写输出层。

输出层权值学习算法:

​​​​2.2 仿真分析

同样可以用以上3中方法进行离散控制器搭建,但是由于权重维度原因,不建议采用状态变量搭建,所以本文用局部变量和延时模块两种方法进行搭建控制器,并且为了对比结果,还是采用同1中模型和跟踪函数,方便进行比对。 

仿真模型:

2.2.1 利用局部变量定义权值仿真分析

 ​​​​​​2.2.2 利用延时模块仿真分析

2.1.3 仿真小结

①不知道什么原因,调了几分钟,总是产生超调,但是换一个模型时又不会;

②反而比单层神经元结果更差,但是换个模型还是不错的;

③可以看到,控制器编写的方法不同,虽然控制器优化的参数会有差异,但是得到的控制输入大小和趋势相同。

3  基于RBF神经网络自适应PID Simulink仿真分析

3.1 原理简介

RBF网络结构

RBF神经网络全称径向基函数神经网络,它的逼近能力很强,但实际上训练能力不如BP神经网络,也是很多场合用BP网络做训练的原因所在。

RBF网络也是一种3层网络,输入映射是非线性的,常用高斯基函数作为非线性映射函数。

式中,X=[x1,x2,...xn]为网络输入向量, Cj=[c1,c2,...cm]为网络中心节点向量。

而隐层到输出层映射是线性的,这也从原理上大致说明其逼近能力强的特点,且避免局部极小值问题。

做如下向量定义:

H=[h1,h2,...,hm]'为RBF网络径向基向量;

B=[b1,b2,...,bm]'为RBF网络的基宽向量;

W=[w1,w2,....,wm]'为RBF网络的权向量。

所以RBF网络的输出为:y=W'*H=w1*h1+w2*h2+....wm*hm

权向量W、基宽向量B和中心节点向量C的的学习算法采用梯度下降法:

式中,η为学习速率;α为动量因子,可以理解为补偿作用。

雅可比矩阵:

 式中,x1=Δu(k);雅可比矩阵决定了输出相对控制输入的灵敏度,求取雅可比矩阵的过程即融合了RBF网络输出的线性映射,所以可以理解为网络的辨识输出。

本文将RBF网络应用于整定PID控制参数上,所以相应的PID参数学习算法为:

3.2 仿真分析

同理,仍选用与单神经元、BP神经网络相同的目标轨迹和模型,仍采用延时模块和局部/全局变量两种方式编写控制器,所建立的simulink模型展示如下:

3.2.1 采用局部/全局变量方法

3.2.2 采用延时模块方法

3.2.3 仿真小结

①RBF的网络对于PID参数的初值选取以及权重选取都很重要;

②两种建模方法的结果有较大差异。

4.学习问题

(1) 基于BP神经网络的控制器,由于激活函数的原因,导致PID参数只能在0-1范围,如何解决,有高手请评论区点播一些谢谢!

(2) 输入向量的选择非常重要,此外涉及的维度关系问题很是关键!

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_50892810/article/details/130982793

智能推荐

基于Kepler.gl 和 Google Earth Engine 卫星数据创建拉伸多边形地图-程序员宅基地

文章浏览阅读965次,点赞18次,收藏21次。现在我们有了 2021 年和 2023 年的 NDVI 数据帧,我们需要从 2021 年的值中减去 2023 年的值以捕获 NDVI 的差异。该数据集包括像素级别的植被值,我们将编写一个自定义函数来根据红色和绿色波段的表面反射率计算 NDVI。在我的上一篇文章中,我演示了如何将单个多边形分割/镶嵌为一组大小均匀的六边形。现在我们有了植被损失数据,让我们使用 Kepler.gl 可视化每个六边形的植被损失。将地图保存为 HTML 文件,在浏览器中打开 HTML 以获得更好的视图。现在我们将调用该函数并使用、

Echarts绘制任意数据的正态分布图_echarts正态分布图-程序员宅基地

文章浏览阅读3.3k次,点赞6次,收藏5次。正态分布,又称高斯分布或钟形曲线,是统计学中最为重要和常用的分布之一。_echarts正态分布图

Android中发送短信等普通方法_android bundle.get("pdus");-程序员宅基地

文章浏览阅读217次。首先要在Mainfest.xml中加入所需要的权限:[html] view plain copyprint?uses-permission android:name="android.permission.SEND_SMS"/> uses-permission android:name="android.permission.READ_SMS"/> _android bundle.get("pdus");

2021-07-26 WSL2 的安装和联网_wsl2 联网-程序员宅基地

文章浏览阅读2.6k次。0、说明最近在学习 Data Assimilation Research Testbed (DART) 相关内容,其软件是在 Unix/Linux 操作系统下编译和运行的 ,由于我的电脑是 Windows 10 的,DART 推荐可以使用 Windows Subsystem For Linux (WSL) 来创建一个 Windows 下的 Linux 子系统。以下的内容主要介绍如何安装 WSL2,以及 WSL2 的联网。1、如何在 Windows 10 下安装WSL具体的安装流程可以在 microso_wsl2 联网

DATABASE_LINK 数据库连接_添加 database link重复的数据库链接命-程序员宅基地

文章浏览阅读1k次。DB_LINK 介绍在本机数据库orcl上创建了一个prod_link的publicdblink(使用远程主机的scott用户连接),则用sqlplus连接到本机数据库,执行select * from scott.emp@prod_link即可以将远程数据库上的scott用户下的emp表中的数据获取到。也可以在本地建一个同义词来指向scott.emp@prod_link,这样取值就方便多了..._添加 database link重复的数据库链接命

云-腾讯云-实时音视频:实时音视频(TRTC)-程序员宅基地

文章浏览阅读3.1k次。ylbtech-云-腾讯云-实时音视频:实时音视频(TRTC)支持跨终端、全平台之间互通,从零开始快速搭建实时音视频通信平台1.返回顶部 1、腾讯实时音视频(Tencent Real-Time Communication,TRTC)拥有QQ十几年来在音视频技术上的积累,致力于帮助企业快速搭建低成本、高品质音视频通讯能力的完整解决方案。..._腾讯实时音视频 分享链接

随便推点

用c语言写个日历表_农历库c语言-程序员宅基地

文章浏览阅读534次,点赞10次,收藏8次。编写一个完整的日历表需要处理许多细节,包括公历和农历之间的转换、节气、闰年等。运行程序后,会输出指定年份的日历表。注意,这个程序只是一个简单的示例,还有很多可以改进和扩展的地方,例如添加节气、节日等。_农历库c语言

FL Studio21.1.1.3750中文破解百度网盘下载地址含Crack补丁_fl studio 21 注册机-程序员宅基地

文章浏览阅读1w次,点赞28次,收藏27次。FL Studio21.1.1.3750中文破解版是最优秀、最繁荣的数字音频工作站 (DAW) 之一,日新月异。它是一款录音机和编辑器,可让您不惜一切代价制作精美的音乐作品并保存精彩的活动画廊。为方便用户,FL Studio 21提供三种不同的版本——Fruity 版、Producer 版和签名版。所有这些版本都是独一无二的,同样具有竞争力。用户可以根据自己的需要选择其中任何一种。FL Studio21.1.1.3750中文版可以说是一站式综合音乐制作单位,可以让您录制、作曲、混音和编辑音乐。_fl studio 21 注册机

冯.诺伊曼体系结构的计算机工作原理是,冯 诺依曼型计算机的工作原理是什么...-程序员宅基地

文章浏览阅读1.3k次。冯诺依曼计算机工作原理冯 诺依曼计算机工作原理的核心是 和 程序控制世界上不同型号的计算机,就其工作原理而言,一般都是认为冯 诺依曼提出了什么原理冯 诺依曼原理中,计算机硬件系统由那五大部分组成的 急急急急急急急急急急急急急急急急急急急急急急冯诺依曼结构计算机工作原理的核心冯诺依曼结构和现代计算机结构模型 转载重学计算机组成原理 一 冯 诺依曼体系结构从冯.诺依曼的存储程序工作原理及计算机的组成来..._简述冯诺依曼计算机结构及工作原理

四国军棋引擎开发(2)简单的事件驱动模型下棋-程序员宅基地

文章浏览阅读559次。这次在随机乱下的基础上加上了一些简单的处理,如进营、炸棋、吃子等功能,在和敌方棋子产生碰撞之后会获取敌方棋子大小的一些信息,目前采用的是事件驱动模型,当下完一步棋界面返回结果后会判断是否触发了相关事件,有事件发生则处理相关事件,没有事件发生则仍然是随机下棋。1.事件驱动模型首先定义一个各种事件的枚举变量,目前的事件有工兵吃子,摸暗棋,进营,明确吃子,炸棋。定义如下:enum MoveE..._军棋引擎

STL与泛型编程-第一周笔记-Geekband-程序员宅基地

文章浏览阅读85次。1, 模板观念与函数模板简单模板: template< typename T > T Function( T a, T b) {… }类模板: template struct Object{……….}; 函数模板 template< class T> inline T Function( T a, T b){……} 不可以使用不同型别的..._geekband 讲义

vb.net正则表达式html,VB.Net常用的正则表达式(实例)-程序员宅基地

文章浏览阅读158次。"^\d+$"  //非负整数(正整数 + 0)"^[0-9]*[1-9][0-9]*$"  //正整数"^((-\d+)|(0+))$"  //非正整数(负整数 + 0)"^-[0-9]*[1-9][0-9]*$"  //负整数"^-?\d+$"    //整数"^\d+(\.\d+)?$"  //非负浮点数(正浮点数 + 0)"^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0..._vb.net 正则表达式 取html中的herf