实值复变函数求导 ——(Wirtinger derivatives)_wirtinger导数-程序员宅基地

技术标签: 算法  虚数  神经网络  数字信号处理  

1.背景知识

在工程应用中,特别是信号处理领域,经常会遇到一些关于复信号的计算,一个典型的例子就是著名的快速傅里叶变换(FFT),它会将实信号也映射为复信号。与实信号相比,复信号包含额外的相位信息。某些物体,例如phase object,其有效信息完全包含在相位信号中。 而且实数作为复数的一个子集,针对复信号设计的算法往往有更加广泛的应用。因此,研究复信号是非常有必要的。    

一些余弦波叠加的FFT分析(图片来源:维基百科)

常见的对的复信号的处理是将其实部和虚部分开,然后进行单独处理,这样就可以用处理实信号的方法解决复信号的问题。但是,这种方法往往包含很多重复步骤分别用来处理实部和虚部。 我们希望能够直接在复数域进行相关分析,从而让整个算法的结构变得更加精简。

信号复原是信号处理中一个重要的方向,主要研究根据测量结果恢复出原始信号,而这个问题常常被看作是一个优化问题。解决优化问题经常要用到函数的梯度,因此有必要研究复变函数的一些求导理论。

2.经典的复变函数可导性

在传统的复变函数理论中,可导性的要求非常严格,具体定义为:如果复变函数f(z)z_0处可导,那么极限

                                                                   \lim_{z \to z_0} \frac{f(z)-f(z_0)}{z-z_0}

总是存在,与z趋近于z_0的路径无关。因此,若将其写成实部和虚部的形式,那么对于函数f(z) = u(z)+iv(z)和变量z = x+iy, 必须满足条件:

                                                                           \frac{\partial u}{\partial x} = \frac{\partial v}{\partial y}, \frac{\partial u}{\partial y} = -\frac{\partial v}{\partial x},

这一性质与势能函数类似,即做功只与始末位置有关,而与路径无关,比如重力势能只与高度有关。因此其在一个封闭路径上的积分为0,从而可导函数具有上述的偏导数约束。 

重力势能(来源:百度百科)

                         

这种定义下的导函数是实数导数理论的一个直接推广,但是适用性较窄,使用时限制条件较多。一类典型的不具有这种可导性的函数包括所有的实值复变函数(非常函数)。对于这种函数,u(z)不为常数,v(z) = 0,因此\frac{\partial v}{\partial y} = \frac{\partial v}{\partial x} = 0,必不满足上述偏导数条件。但是,这类实值函数在实际应用中很常见,一个例子是评价函数。对于一个复原后的复信号,我们对它的评价一定为一个实数,这样才可以用该指标的大小评价信号的好坏(一般复数无法直接比较大小)。在模仿深度学习进行误差反向传播更新的过程中,必然会涉及到实值复变函数的求导,而上述导数定义无法使用,因此引入了Wirtinger导数体系解决这个问题。

3. Wirtinger 导数

Wirtinger 导数由Remmert与1995年提出 [1],用于解决实值复变函数的问题。首先通过实部与虚部分离的方法研究一个复变函数f(z) = F(x,y) = U(x,y)+iV(x,y), z = x+iy的微分问题。根据多元函数的微分性质

                                                dF = \frac{\partial F}{\partial x} dx +\frac{\partial F}{\partial y} dy = \frac{\partial U}{\partial x} dx + \frac{\partial V}{\partial x} idx + \frac{\partial U}{\partial y} dy + \frac{\partial V}{\partial y} idy,

根据z与x和y的关系,可将其改写成关于z的微分:

                                                                              x = \frac{z+z^*}{2}, dx = \frac{dz+dz^*}{2}\\ ~~~~~y = \frac{z-z^*}{2i}, dx = \frac{dz-dz^*}{2i},

带入上式可得,若dF = \frac{\partial F}{\partial z}dz + \frac{\partial F}{\partial z^*}dz^*,那么

                                                                                  \frac{\partial }{\partial z} = \frac{1}{2}(\frac{\partial }{\partial x}-i\frac{\partial }{\partial y})\\ ~~~~~\frac{\partial }{\partial z^*} = \frac{1}{2}(\frac{\partial }{\partial x}+i\frac{\partial }{\partial y}),

这两个导数就被称为Wirtinger导数(Wirtinger derivatives)。

根据上述定义,可以得到一个Wirtinger求导法则中非常重要的一组等式

                                                              \frac{\partial z^*}{\partial z} = \frac{1}{2}\left[\frac{\partial x}{\partial x}-i\frac{\partial (-iy)}{\partial y}\right] = 1-i*(-i) = 0\\ ~~~~~\frac{\partial z}{\partial z^*} = \frac{1}{2}\left[\frac{\partial x}{\partial x}+i\frac{\partial (iy)}{\partial y}\right] = 1+i*i = 0.

类比多元函数中偏导数恒为零的情况,我们可以很自然得得出一个结论:在Wirtinger求导法则中,zz^*可以看作两个互不相关的变量,只要分别对其单独求导即可。例如,对z求导时,可将z^*看作常量,反之亦然。

最后举一个例子。复数的模平方的计算公式为\|z\|^2 = z^*z,那么在Wirtinger导数体系下,其关于z的导数为

                                                                 \frac{\partial \|z\|^2}{\partial z} =\frac{\partial z^*z}{\partial z} = z^*, \frac{\partial \|z\|^2}{\partial z^*} =\frac{\partial z^*z}{\partial z^*} = z.

模函数也为一个实值函数,它也具有实值函数特有的求导性质

                                                                                         dF = 2Re(\frac{\partial F}{\partial z}dz).

对于梯度下降法,其最速下降方向为\frac{\partial F}{\partial z^*},其中F为实值复变函数。

参考文献:

[1] Remmert, R. (1991). Theory of complex functions (Vol. 122). Springer Science & Business Media.

[2] (一份实用课件) https://mediatum.ub.tum.de/doc/631019/631019.pdf

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_37872766/article/details/107673096

智能推荐

easyUI中datagrid单选时复选框不取消问题_easyui datagrid 设置singleselect:true 后不能取消选择-程序员宅基地

文章浏览阅读472次。圈起来的地方是需要注意的这里的代码可以多选,也可以把多选的复选框全部取消勾选如果singleSelect改为true,就不能取消勾选,至于为什么,我还没弄懂(笑哭)_easyui datagrid 设置singleselect:true 后不能取消选择

TinoyOs和nesC语言-程序员宅基地

文章浏览阅读479次。nesC语言编程基础1.接口NesC程序主要由各式组件(component)构成,组件和组件之间通过特定的接口(interface)互相沟通。一个接口内声明了提供相关服务的方法(C语言函数)。例如数据读取接口(Read)内就包含了读取(read)、读取结束(readDone)函数。接口只是制定了组件之间交流的规范,也就是通过某一个接口,只能通过该接口提供的方法实现两个组件之间的交流。但是接口终归只是接口,只是一组函数的声明,并为包含对接口的实现。1 interface Read<val._nesc语言

漫谈iOS Crash收集框架_swift崩溃处理框架-程序员宅基地

文章浏览阅读1.3k次。为了能够第一时间发现程序问题,应用程序需要实现自己的崩溃日志收集服务,成熟的开源项目很多,如KSCrash,plcrashreporter,CrashKit等。追求方便省心,对于保密性要求不高的程序来说,也可以选择各种一条龙Crash统计产品,如Crashlytics,Hockeyapp,友盟,Bugly等等。 是否集成越多的Crash日志收集服务就越保险? 自己收集的C..._swift崩溃处理框架

java word转pdf 用到了aspose 1.86 破解版jar在链接下面 只提供技术分享 请支持正版_aspose-pdf-17.8.jar-程序员宅基地

文章浏览阅读2.3k次。接上个的博客 这里来写 word转pdf 有两种方式 第一种 是不能带图片的 下载一个jar包就能直接用了第一种:创建项目导入包 复制粘贴代码 ok (包在下面链接中)这个是查看于一个csdn的博主所得 但是不满足需求 只是转换了文字段落 并没有图片和表格转换 非常有研究价值。/** * 将word文档, 转换成pdf, 中间替换掉变量 */ p..._aspose-pdf-17.8.jar

udk开发-稀里糊涂_networkinterfaceidentifierprotocol-程序员宅基地

文章浏览阅读1.4k次。在此情况下,DXE Runtime Driver必须创建一个signal类型的Event,当SetVirtualAddressMap() 被OS调用的时候,该Event将被通知。​ DXE Runtime Driver创建的signal类型的Event所用到的通知函数不允许直接或者间接使用UEFI Boot Services、**UEFI Console Services **或者 UEFI Protocol Services。所有的Set或者Get的值在boot time memory关闭后将会丢失。_networkinterfaceidentifierprotocol

c语言中struct和typedef struct的用法_typedef struct用法-程序员宅基地

文章浏览阅读2.2k次,点赞18次,收藏51次。基本形式在C语言中,可以使用结构体(Struct)来存放一组不同类型的数据。结构体的定义形式为:struct 结构体名{ 结构体所包含的变量或数组};结构体是一种集合,它里面包含了多个变量或数组,它们的类型可以相同,也可以不同,每个这样的变量或数组都称为结构体的成员(Member),比如????struct stu{ char *name; //姓名 int num; //学号 int age; //年龄 char group; //所在学习小组_typedef struct用法

随便推点

图像处理之常见二值化方法汇总-程序员宅基地

文章浏览阅读10w+次,点赞25次,收藏117次。图像处理之常见二值化方法汇总图像二值化是图像分析与处理中最常见最重要的处理手段,二值处理方法也非常多。越精准的方法计算量也越大。本文主要介绍四种常见的二值处理方法,通常情况下可以满足大多数图像处理的需要。主要本文讨论的方法仅针对RGB色彩空间。 方法一:该方法非常简单,对RGB彩色图像灰度化以后,扫描图像的每个像素值,值小于127的将像素值设为0(黑色),值大于等于12_二值化

GUI程序开发_gui开发-程序员宅基地

文章浏览阅读1.9k次。JAVA程序设计与应用开发(第2版)——《GUI清华大学出版社》_gui开发

PYTHON实训总结及体会500字,PYTHON实训总结思考建议_python实验体会-程序员宅基地

文章浏览阅读491次。大家好,给大家分享一下PYTHON实训总结及体会1500字,很多人还不知道这一点。这将使你在做实验时的难度加大。然后两下子就将实验报告做完。但学到的知识与难度成正比。一定要将课本上的知识吃透。【篇一:实验心得体会】就像以前做物理实验一样。在老师讲解时就会听不懂。你要清楚电桥的各种接法。这将使你极大地浪费时间。在做测试技术的实验前。因为这是做实验的基础。_python实验体会

ADC参数详解_adc电流电压零漂值-程序员宅基地

文章浏览阅读9.6k次,点赞9次,收藏117次。特性或指标总述本文将从以下特性进行简单的叙述。结合了《ADC设计基础》和TI的一些教学视频。分辨率转换误差转换速度采样率奈奎斯特采样准则混叠和抗混叠滤波器DNLINL热噪声谐波失真THDSNRENOBSFDRIMD孔径抖动孔径延迟奈奎斯特区补充分辨率一般ADC都说注明是8bit,16bit或者是24bit。这里的数值也就是分辨率的意思。分辨率是衡量A..._adc电流电压零漂值

服务器阵列卡缓存显示错误,服务器阵列卡(缓存)-程序员宅基地

文章浏览阅读1.1k次。RAID卡介绍:提到RAID卡就不得不提到什么是RAID。RAID是英文Redundant Array of Independent Disks的缩写,翻译成中文即为独立磁盘冗余阵列,或简称磁盘阵列。简单的说,RAID是一种把多块独立的硬盘(物理硬盘)按不同方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据冗余的技术。组成磁盘阵列的不同方式成为RAID级别(RAID..._把raid缓存强制开启 显示参数无效

您绝对不能错过的 10 个 OKR 示例!_优秀的okr案例-程序员宅基地

文章浏览阅读429次,点赞6次,收藏8次。在此基础上,制定团队 OKR,它可以是产品层面的或部门层面的,但它们会融入组织的目标中。使用 OKR 方法的一个巨大好处是,它可以针对不同的部门和团队进行细分, 以便整个公司追求相同的组织目标,但利用特定的关键结果。如果您没有达到 100% 的关键结果,您仍然应该为实现这一目标所付出的努力感到自豪,评估是否需要进行更改,并重新调整下一个周期的目标和关键结果。令人惊讶的是,伦敦商学院进行的一项研究显示,在接受调查的 11,000 名高级管理人员中,只有三分之一能够列出他们公司的三大优先事项。_优秀的okr案例

推荐文章

热门文章

相关标签