导数在经济中应用论文提纲

2022-08-04

论文题目:Wasserstein空间中关于测度的偏导数及其在受控的平均场系统中的应用

摘要:平均场随机微分方程,也称为Mckean-Vlasov方程,在统计力学、物理学、量子力学和量子化学等领域都有着广泛的应用。2007年,J.M.Lasry,P.L.Lions[62]首次给出了此类方程在经济、金融以及随机微分对策中的应用。Buckdahn,Djehiche,Li,Peng[16]完全借助于随机方法研究了一类特殊的平均场问题,推导得出一种新型的倒向随机微分方程,称为平均场倒向随机微分方程。自此,越来越多的学者开始研究这类McKean-Vlasov型方程,相关的最优控制问题也受到广泛关注。2013年,法国科学院院士 P.L.Lions[73]首次引入了函数关于测度的可微性的定义,这将平均场问题的研究提升到了一个新的高度。受此启发,Buckdahn,Li,Ma[19]研究了一类推广的平均场随机控制系统,其系数不仅依赖于状态过程,还依赖于状态过程的分布,他们借助于Peng[84]提出的变分方程的二阶泰勒展开方法给出了全局随机最大值原理。在受控系统中,“参与者”需要基于自己已掌握的信息进行决策。但是现实中会经常出现不完全信息的情况,“参与者”无法观测到所有的信息或者并不是所有信息都是有效的,只能通过掌握的部分信息来进行决策。因此,研究基于部分观测的随机控制问题具有重要的现实意义。本论文主要研究了两方面的内容:一、在对第二边际分布μ2=μ(Rd ×·)没有正则性假设的情况下,研究函数以第二边际分布μ2为条件,关于分布μ的偏可微性质;二、研究Wasserstein空间中关于测度的偏导数在随机控制问题中的应用:带部分观测的平均场受控系统下的最大值原理。下面将详细的介绍论文的内容及结构。第一章主要介绍了论文第二章和第三章中所研究的问题以及研究背景。第二章主要研究了 Wasserstein空间中关于测度的偏导数。设(E,ε)为任意一个可测空间,研究函数f:P2,0(Rd × E)→R的偏导数,其中,P2,0(Rd × E)是定义在(Rd × E,B(Rd)(?)ε)上的概率测度μ的集合并且满足其第一边际分布μ1:=μ(·×E)具有有限二阶矩。概率测度μ关于其第二边际分布μ2(·)=μ(Rd ×·)具有如下分解:μ(dxdz)=q(dx,z)μ2(dz)。本章所研究的是f关于q(dx,z)的偏导数,简单来讲,我们研究的是以第二边际分布为条件的关于测度μ的偏导数。本章的主要创新点:P.L.Lions[73]中给出了函数g:P2(Rd)→R关于测度的导数,这里的P2(Rd)是定义在Rd上具有有限二阶矩的概率测度全体。我们注意到,由于空间(E,ε)仅满足可测性条件,在这种情况下函数f:P2,0(Rd × E)→ R关于测度μ是不具备全局可微性的,本章的研究内容推广了[73]中的结果。第三章探讨了 Wasserstein空间中关于测度的偏导数在随机控制问题中的应用,受控状态过程由带部分信息的一般平均场随机微分方程驱动。控制集仅仅是一个可测集,受控系统的系数(即动力系统的系数和代价泛函的系数)依赖于受控状态过程X,控制v,关于X的部分信息以及(X,v)的联合分布,我们研究了这个控制系统下最优控制的必要条件,即随机最大值原理。变分方程的二阶展开是证明随机最大值原理的关键,但是由于系数b和σ不仅依赖于E[Xt1]FtW1],而且还依赖于联合分布P(x,v),所以在证明二阶展开时有一些技术上的困难,这里采用了新方法证明了相关估计。本章的主要创新点:将控制集推广到一般的可测集情形,并且控制系统是一个推广的受控平均场随机微分方程且依赖于部分信息。处理部分信息以及分布项的估计都采用了技术性较强的方法,其中,对于反映平均场受控系统特性的估计,我们提出了一个算子方法来进行证明,这是一个与经典情形不同的全新方法。上述两章来自于论文:R.Buckdahn,Y.Chen,J.Li.Partial derivative with respect to the measure and its application to controlled mean-field systems with partial information.已投稿.本文由上述三个章节组成,以下是本文的章节结构和主要结论。一、第一章引言;二、第二章Wasserstein空间中关于测度的偏导数;三、第三章带部分观测的平均场受控系统的随机最大值原理。第二章:我们主要研究了在对第二边际分布μ2=μ(Rd×·)没有正则性假设的条件下,函数以第二边际分布μ2为条件,关于分布μ的偏可微性质。设(E,ε)为任意一可测空间。我们记P(Rd × E)为定义在(Rd ×E,B(Rd)(?)ε)上所有概率测度的集合,同时我们记P2,0(Rd × E):={μ∈P(Rd × E):∫Rd×E|x|2μ((dxdz)<+∞}.对概率测度μ∈P2,0(Rd ×E),我们记μ的边缘分布为μ1(A):=μ(A × E),A∈B(Rd),μ2(B):=μ(Rd × B),B∈ ε,给定函数f:P2,0(Rd × E)→ R,以及任意μ ∈P2,0(Rd × E),我们想要研究f在μ处关于q(dx,:)的偏可微性质,其中μ(dxdz)=q(dx,z)μ2(dz)。我们将q记作qμ。记(?)(ξ,v):=f(P(ξ,v)),(ξ,v)∈L2(F;Rd)× L0(F;E),为f在 L2(F;Rd)× L0(F;E)上的提升函数。在Frechet,导数的意义下,我们如下定义函数f的偏可微性。定义0.1 称f:P2,0(Rd × E)→ R在μ∈P2,0(Rd × E)处关于qμ是偏可微的,如果存在某个随机变量(ξ,v)∈L2(F;Rd)× L0(F;E),且其联合分布为P(ξ,v)=μ,使得ξ’→fv((ξ’):=f((ξ’,v)作为定义在Hilbert空间L2(F;Rd)上的函数在ξ处是Frechet可导的。记Frechet导数为(?)∈ L((L2(F;Rd);R),根据Riesz表示定理可以得到,存在随机变量(?)∈ L2(F;Rd),有f(P(ξ+η,v)-f(P(ξ,v)=(?)+o(|η|L2)=(?)+o(|η|L2)对于任意η∈ L2(F;Rd)且 |η|L2:=(E[|2])1/2→ 0。为了证明关于分布的偏可微性质,我们需要讨论以下技术性结论。引理0.2(Ω,F)是一个Radon空间,即,这个空间中的任意Borel概率测度是内正则的。Radon空间有如下的等价性质:(Ω,F)满足正则条件概率性质,i.e.,对任意(Ω,F)上的概率测度P,任意可测空间(E,ε)及任意可测映射v:Ω→E,存在正则条件概率测度P|v=.:E ×F→[0,1],使得ⅰ)P|v=z(·)是F上的概率测度,对任意z∈E;ⅱ)P|v=(A):E→[0,1]是ε-可测的,对任意A ∈ F;ⅲ)P{A|v=z}=P|v=z(A),Pv(dz)-a.s.,对任意z ∈E及A ∈F。设ξ,θ∈L2(F;Rd),v是一个定义在(Ω,F,P)上取值于可测空间(E,ε)的可测映射。设γ∈L2(F,Rd)为一独立于(ξ,θ,v)的标准Gaussian向量。对任意ε>0,我们取θε:=θ+εγ。命题0.3 引用上述记号,对任意ε>0,存在一个可测映射Hε:Rd × E→Rd使得,Pv(dz)-a.s.对于 z∈E,ⅰ)PHε(θε,v)=z=Pξ|vz,ⅱ)E[|ξ-θε|2|v=z]≥E[|Hε(θε,v)-θε|2|v=z].现在我们将P.L.Lions给出的关于概率测度可微性的基础结果做出以下推广:根据引理0.2以及命题0.3,我们可以将关于测度的偏导数刻画为一个Borel函数,且这个函数仅通过分布F(ξ,v)内依赖于(ξ,v)。定理0.4在以上假设和记号下,存在μ(dydz)-a.s.唯一可测函数g:Rd× E →Rd使得Dfv(ξ)=g(ξ,v),P-a.s.另外,函数g=(y,z)依赖于(ξ,v)仅仅通过它的分布μ=P(ξ,v)。由上面的定理,我们可以定义:((?)μf)1(μ,y,z):=g(y,z),(y,z)∈Rd × E,并称其为函数f:P2,0(Rd ×E)→ R在μ处关于q(dy,z)的偏导数。此外,我们注意到这个函数是μ(dydz)-a.s.唯一定义在Rd × E中的。第三章:研究了平均场框架下,带部分信息的受控系统的最优控制问题。本章中的控制集仅仅是一个可测集,受控系统的系数(即动力系统的系数和代价泛函的系数)依赖于受控状态过程X,控制v,关于X的部分信息以及(X,v)的联合分布,我们研究了这个控制系统下最优控制的必要条件,即全局随机最大值原理。我们考虑有如下状态方程的最优控制问题(?)t∈[0,T],最优控制问题的目标是在可容许控制集uad上最小化如下代价泛函:J(v):=E[∫0T(t,P(xt,v,vt),Xtv,E[Xtv|FtW1],vt+φ(PXTv,XTv,E[XTv|FTW1])],称u ∈ uad为最优控制,如果满足#12为了得到随机最大值原理,我们需要引入如下一阶和二阶伴随方程:#12#12其中H(t,μ,x,y,v,p,q):=pb(t,μ,x,y,v)+qσ(t,μ,x,y,v)-f(t,μ,x,y,v).现在我们介绍一阶和二阶变分方程:(?)t∈[0,T],#12定义最优控制u的针状变分如下:Uε(t):=v(t)IEε(tl)+u(t)IEεc(t),t∈[0,T],记X:=Xu和Xε:=Xuε分别是关于u和uε的受控状态过程。下面的命题验证了变分方程的正确性。命题0.5假设(H3.2.1)成立,对任意p>1,存在一个依赖于p的常数Cp>0,使得,对任意ε ∈(0,1],#12#12下面两个技巧性的估计对得到Xε的二阶展开式起到了重要作用。命题0.6设θ ∈ LF2(0,T)且满足Eθt2]≤Cθ,t∈[0,T]。则有:存在一个函数ρ:[0,T]× R+→ R+满足:当 ε→ 0 时,ρt(ε)→ 0,并且ρt(ε)≤ Cθ’,t ∈[0,T],ε>0,且有| E[θtXt1]|≤ρt(ε)(?),ε>0,t∈[0,T],其中cθ,Cθ’为仅通过E[θt2]∈[0,T]的界限依赖于θ的常数。引理0.7假设(H3.2.1),(H3.2.2)以及(H3.2.3)成立。那么,对于任意的p ≥ 2,存在某个函数ρt(p):R+→ R+满足:当ε → 0时,ρt(p)(ε)→ 0,并且ρt(p)(ε)≤Cp,t∈[0,T],ε>0,对某个Cp ∈ R+成立,且有E[|E[Xt1|FtW1]|p]<ε2/p(ε),t ∈[0,T],ε>0.下面的命题给出了关于Xε的二阶展开式,也是证明最大值原理的关键所在。命题0.8假设(H3.2.1),(H3.2.2)以及(H3.2.3)成立。那么,对于任意的1 ≤ p≤2/3,我们有#12其中ρ(·)是定义在(0,∝)上的正值函数,使得ρ(ε)→0,当ε→0时。现在,我们给出如下随机最大值原理。定理0.9假设(H3.2.1),(H3.2.2)以及(H3.2.3)成立,并且设(u,X)为控制问题(3.2.1)-(3.2.3)的最优解。则有:对任意的v∈uad,a.e.t∈[0,T],P-a.s.H(t,P(Xt,vt),Xt,E[Xt |FtW1],vt,pt,qt)-H(t,P(Xt,ut),Xt,E[Xt|FtW1],ut,pt,qt)+1/2Pt|σ(t,P(Xt,vt),Xt,E[Xt|FtW1],vt)-σ(t,P(Xt,ut),Xf,E[Xt|FtW1],ut|2≤0.其中,F-适应过程(p,q)和(P,Q),分别为一阶、二阶伴随方程的解。此外,考虑标准维纳空间(Ω=ρC([0,T];R2),F=B(Ω)∨NP,P),W=(W1,W2)为坐标过程,如果对于任意的(t,ω,x,y,v),系数b(t,μ,x,y,v),σ(7(t,μ,x,y,v)和f(t,μ,x,y,v)在W,TV(·,·)-度量下关于μ∈ P2,0(Rd × E)是模连续的,其中连续模ρ:R+→R+是个递增连续函数,满足ρ(0)=0,则有:对任意v∈ Uad以及(?)∈ U,dtdP-a.e.,H(t,P(xt,vt),Xt,E[Xt|FtW1],(?),pt,qt)-H(t,P(Xt,ut),Xt,E[Xt|FtW1],ut,pt,qt)+1/2Pt|σ(t,P(Xt,vt),Xt,E[Xt|FtW1],(?))-σ(t,P(X,tXt,E[Xt|FtW1],ut)|2≤0.

关键词:关于测度的偏导数;Frechet导数;平均场随机微分方程;最优控制;部分信息;随机最大值原理;非凸控制域;针状变分

学科专业:概率论与数理统计

中文摘要

英文摘要

符号说明

第一章 引言

1.1 Wasserstein空间中关于测度的偏导数

1.2 带部分观测的平均场受控系统的随机最大值原理

第二章 Wasserstein空间中关于测度的偏导数

2.1 预备知识:关于测度的导数

2.2 问题描述和符号说明

2.3 Wasserstein空间中关于测度的偏导数

2.4 命题2.3.1和定理2.3.1的证明

第三章 带部分观测的平均场受控系统的随机最大值原理

3.1 引例

3.2 问题描述与符号说明

3.3 变分方程

3.3.1 对偶关系

3.3.2 泰勒展开及相关估计

3.4 随机最大值原理的证明

参考文献

致谢

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:自然灾害与农业经济论文提纲下一篇:企业财务成本核算论文提纲