如何在r中输入广义pareto分布的广义极值概率密度函数数

Generalized Pareto Distribution (GPD)
编辑:www.fx114.net
本篇文章主要介绍了"Generalized Pareto Distribution (GPD) ",主要涉及到Generalized Pareto Distribution (GPD) 方面的内容,对于Generalized Pareto Distribution (GPD) 感兴趣的同学可以参考一下。
广义帕雷托分布
广义Pareto分布
MATLAB中如何产生pareto分布
函数   X = gprnd(X,K,sigma,theta,[M,N,...])  。当 sigma=theta 时,就可以生成通常的pareto分布。
X = gprnd(1/2,15,15,1,10^6),即尾部参数为 alpha=2, 位置参数为 k = 15。
function r = gprnd(k,sigma,theta,varargin)
%GPRND Random arrays from the generalized Pareto distribution.
%   R = GPRND(K,SIGMA,THETA) returns an array of random numbers chosen from the
%   generalized Pareto (GP) distribution with tail index (shape) parameter K,
%   scale parameter SIGMA, and threshold (location) parameter THETA.  The size
%   of R is the common size of K, SIGMA, and THETA if all are arrays.  If any
%   parameter is a scalar, the size of R is the size of the other parameters.
%   R = GPRND(K,SIGMA,THETA,M,N,...) or R = GPRND(K,SIGMA,[M,N,...]) returns
%   an M-by-N-by-... array.
%   When K = 0 and THETA = 0, the GP is equivalent to the exponential
%   distribution.  When K & 0 and THETA = SIGMA, the GP is equivalent to the
%   Pareto distribution. The mean of the GP is not finite when K &= 1, and the
%   variance is not finite when K &= 1/2.  When K &= 0, the GP has positive
%   density for X&THETA, or, when K & 0, for 0 &= (X-THETA)/SIGMA &= -1/K.
%   See also GPCDF, GPFIT, GPINV, GPLIKE, GPPDF, GPSTAT, RANDOM.
%   GPRND uses the inversion method.
%   References:
%      [1] Embrechts, P., C. Klüppelberg, and T. Mikosch (1997) Modelling
%          Extremal Events for Insurance and Finance, Springer.
%      [2] Kotz, S. and S. Nadarajah (2001) Extreme Value Distributions:
%          Theory and Applications, World Scientific Publishing Company.
%   Copyright
The MathWorks, Inc.
%   $Revision: 1.1.6.1 $  $Date:
16:44:41 $
一、不得利用本站危害国家安全、泄露国家秘密,不得侵犯国家社会集体的和公民的合法权益,不得利用本站制作、复制和传播不法有害信息!
二、互相尊重,对自己的言论和行为负责。
本文标题:
本页链接:扫二维码下载作业帮
3亿+用户的选择
下载作业帮安装包
扫二维码下载作业帮
3亿+用户的选择
求教概率论 一般Pareto分布设损失服从一般Pareto分布,其密度函数为:f(x)=rθ^r/[(θ+x)^(r+1)].且均值为33,方差为109^2,试确定该分布的95%分位数.并求其95%CTE﹙Conditional Tail Expection﹚即伪条件期望.打错。是“尾条件期望”。= =
作业帮用户
扫二维码下载作业帮
3亿+用户的选择
为您推荐:
其他类似问题
扫描下载二维码当前位置: >>
广义Pareto分布
华东师范大学 硕士学位论文 广义Pareto分布 姓名:南新艳 申请学位级别:硕士 专业:概率论与数理统计 指导教师:王静龙
摘要从Parcto分布的诞生到现在已有150多年的历史了.随着时间的推移、社会的发 展,Parcto分布也在不断地完善、改进、推广,从而形成了多种形式的Parcto分布、广 义Pa_rcto分布乃至Pareto分布族.Parcto分布族由于其具有的优良性质得到诸多学科 研究者的青睐.本文首先对Pareto分布的发展作了简单的介绍,并介绍_r Parcto分布 族在经济学、社会学、环境学、保险精算学中的广泛应用.Pareto分布族中的两个分布已被列入精算师常用的八大分布之中,由此可见Pareto分布族的实际应用价值,也说明了我们对Parcto分布族研究的重要意义. 本文第二章分别介绍了Pareto分布族中各个分布的密度函数、矩、众数、Fisher信 息阵、次序统计量、参数估计等一些性质,并介绍了Parcto分布族内各个分布之间以及它们与其它分布之间的相互关系.从而可以比较清楚地了解到Parcto分布族中的各个分布是如何发展而来的,它们之间有何关系,它们之间有什么区别.同时还可以了解到 Pareto分布族中的各个分布与均匀分布、F分布、Bcta分布以及z分布之间的关系. 第三章是本文的重点。也是本文的重要创新之处.本章主要包括四部分内容,第一部 分主要描述广义Pareto分布的一些基本性质,给出广义Parcto分市的两种特殊形式, 并对广义Pareto分布的一些数字特征进行研究.用图的形式描述了不同参数取值对分布 形状及位性的不同影响,当参数p取正整数时,采用数学归纳的方法推导出广义Parcto分布的分布函数,这是本文的创新点之一.第二部分主要是参数的估计,包括矩估计、极大似然估计、区间估计,以及基于正态逼近的一些推断.本文证明了矩估计和极大似 然估计的同变性,这是本文的又一创新点.对次序统计量的部分相关性质也作了研究. 第三部分主要研究假设检验,区间估计是一种参数的估计方法但同时也是一种参数假设 检验的方法,该部分对区间估计的检验方法进行了探讨.似然比方法足很重要的一种假 设检验方法,同样在本文中似然比检验方法发挥了其强大的威力.第四部分主要讨论了 广义Parcto分布在实际中的应用,并通过棒球运动员收入的例子和飓风损失的例子进行了说明.5 ABSTRACTPareto distribution appeared 150 years ago.With the development of society,Paretodistribution has been improved and extendcd to severnl kinds of Pareto distribution,which formed Pareto Distribution Family.Pareto Distribution Family deservesSOmanyresearchersl attention because of its’excellent properties.This paper introduces the de- velopmcnt of Pareto Distribution Family and it’S application in Economics,Sociology,Euthenics and Actuarial Statistics Twe of Pareto Distribution Family llave often beentoused by actuary.So,it is significativeresearch Pareto Distribution Family.Probability density function,moment,mode,Fish information nmtrix,order statistics and parameter estimator is introduced in the second part The relation among the ParetoDistribution Family inside is introduced too.Such wePareto Distribution Family.And wecancanundcrstandthe development ofknow the relation between the distributions ofPareto Distribution Family and uniform distribution,F distribution,Beta distribution,Z distribution. Generalized Pareto distribution is introduced in the third part which is the keystone of this paper.The difference between generalized Pareto distribution and the Pareto distri― butionmentionedin the paper of Lihaifen is the bound of variable is Basedonextended,parameter calculated.Theis added to threetile probability density function and other characters,thearemoment and distribution function of gcneralized Pareto distributionparameter estimators including moment estimator,maximum likelihood estimator andintcrvaI estimatorareanalyzed.Basedontim nornlal infer.soInc charactcrs of maximumlikelihood estimator Pareto distributionarere.searched.Ordel’statistics and itsl distributions of generalizedintroduced Likelihood―ratio test isaareimportant parametertestmethod which it is appliedto generalizedPareto distribution.Generalized Pareto dis.astribution play key role in practical cases,suchincome data exceedafixedbound.hurricane loss andSOon.It is important to research generalized Pareto distribution6 南新艳硕士学位论文答辩委员会成员名单姓名职 教称 授单位备注 主席朱仲义 程依明 丁邦俊华东师范大学统计系 华东师范大学统计系 华东师范大学统计系副教授 副教授4 学位论文独创性声明本人所呈变的学位论文是我在导师的指导下进行的研究工作及取得的研究成果.据我所知,除文中已经注明引用的内容外,本论文不包含其他个人已经发表或撰写过的研 究成果.对本文的研究做出重要贡献的个人和集体,均已在文中作了明确说明井表示谢 意.作者签名;镉≥i斗4色日期;玉惦曩,学位论文授权使用声明本人完余了解华东师范大学有关保留、使用学位论文的规定,学校有权保留学位沦文并向国家主管部门或其指定机构送交论文的电子版和纸质版.有权将学位论文用于非 赢利目的的少量复制并允许论文进入学校图书馆被查阅.有权将学位沦文的内容编入有关数据库进行检索.有权将学位论文的标题和摘要}亡编出版.保密的学位论文在解密后 适用奉规定.学位论文作者签名嗍二艳j3日期;知F.F、3,导师签名2嗍卜百日期:山甜r.f.9 第一章§1绪论Pareto分布族的发展历史Pareto分布是根据出生在意大利的瑞士经济学教授Vilfredo Pareto(1848―1923)的名 字来命名的.关于Pareto分布及其相似分布的研究源于1897年在罗马出版的由VikfrcdoParcto著的经济学书. 1一P(x1=Gzo其中F(x)为收入不超过z的个体所占的比列.其中C为某个实数,o为正数.这一分布我们称之为经典的Pareto分布.在Pareto分布刚刚出现的一段时期内,很多经济学家采用它对各种收入数据进行拟 合研究分析,曾经一度引起了Pareto分布应用的热潮.但随着经验的逐步积累,人们发 现Pareto分布并不适合用来拟合整个收入范围内的数据,只是对高收入人群部分的数据 拟合的比较好.这样Parcto分布的研究和应用进入r相对低潮的阶段.相关研究人员开 始重新认真仔细地研究Pareto的一些性质和应用.事实上,收入分布是后尾分布,丽 Pareto分布是典型的偏态、后尾分布,因此Parcto分布理所当然地在研究收入分布的尾 部情况时发挥重要作用,正如正态分布在试验科学中所起的作用一样.在Pareto分布F(z)=l―CXl中,Q称为Pareto指数,Parcto发现参数Q 在1.5附近作微小的变化.因此他一直认为有某种潜在的规律来决定收入分布的形式. 例如在日本,每年个人所得税超过1000万日元的人被称为“高收入纳税人”,他们的收入分布遵循Pareto规律,且Pareto指数通常在2.0左右变动,在日本经济泡沫破灭时, Parcto指数的变动范围为1.8―2.0.除个人收入外,公司高收入分布也遵循Pareto分 布,在日本年收入超过4,000万日元的公司被称为“高收入公司”。它们的收入分布遵循Parcto规律,且Pareto指数在1.0附近变动.在经济领域中,经济学家主要致力于采用适当的方法对参数a进行估计.通常都假设a>1,实践证明这个假设是很合理的.在Bresciani.Turroni(1939)中提出f-“a的实际值落在相对较小的区间中,大于在1.5附近波动.”的观点,并且认为“引起a波动的原因更多 的是来自统计资料的不精确而非现实经济现象本身的原因4.30年之后,Cramer(1971)记载有“在发达国家中,a的值已从19世纪的16―18上升为1.9―2l*.在过去的60年中,Parcto定律受到一些著名经济学家的反驳,如Pigou(19321、 Shirras(1935)、Hayakawa(1951)但最近又有很多经济学家尝试用Parcto分布或其相近分布取解释一些经验现象如Stcindl(1965),Mandelbrot(1960,1963,1967),Hagstroem(1960). 第一章绪论华东师范大学硕士论文2Ord(1975). 徐龙炳在《金融研究》中的“中国股票收益稳态特性”一文中指出,股票市场具有复杂的非线性动力系统的特征,既受确定性规律支配,同时又表现出某种随机现象,具 有时变性、随机性、模糊性的特点.早在有效市场假说完全形成之前,人们已经发现了市 场收益不符合正态分布的假定,收益率之间也不独立.大量的实证研究表明,股票收益 分布明显偏离正态分布,呈现厚尾特性,很多金融学家采用Parcto分布对此经济现象进行研究探讨.全民在医疗保健方面的消费情况对国家出台医疗政策有很大影响.经研究发现单个 病人的保健消费数据典型地呈现偏态、厚尾,Pareto被用来分析尾部情况.Pareto分布族在环境学中也有很广泛的应用,如对海浪,风力、气温、降雨等自然现象的研究很多都采用了Pareto分布族.s Cabras和M.E.Castellanos对Nidd河流的 1934年到1969年的年度最大流量作了统计分析,该河流位于英格兰[hmsingore Weir.洪水灾害带来的损失不可估量,科学地分析某地区历史降雨记录数据,准确有效地预测现有及未来降雨情况显得尤为重要.2004年SerguiFJuarez等人用Pareto分布对自从1904年至2002年月度累计降雨量超过300mm的历史数据进行了探讨研究 一个多世纪以来随着Pareto分布在各个领域的广泛应用,对此感兴趣的学者越来越 多,并在不断研究的同时对Pareto分布进行改进发展得到多种推广形式,我们称之为广 义Parcto分布.前人的研究大多数是两个参数的Pareto,在本文中我们将对三参数的 广义Pareto分布进行研究.Pareto分布的最原始的形式如下F父(z)=P(X>z)=(二)。, X这足Pearson一}k>0,口>0,z≤七V1分布找们记为x―P(州%,a).n8Pareto又提出两种Pareto分布,Pareto(II)(C,a)分布(有时也称为Lomax分布),取(z)=1一万击币。≤0这也足PcarsonVl分布.Loma.x(1954)用该分布来对商业失败数据作分析.当C;l时为标准P(II)分布,其pdf为px(X)=a(1+£)1~,z>0,a>0生存函数为氏(z)=(1+。)~, z>0, a>0.随着理论和实际应用的需要,引入位置参数“,P(II) 分布的生存函数为段(z)=(1+!萨)一, z>p.e,Ⅱ>0.通常肛非负,假定a大于 1,这样可以保证期望为有限值,该分布表示为尸(,驯p,G口).Pareto提出的第三种分布是取(z)=卜渤,z>o?Iz十乙厂记为X―P(III)(a,b,c) 第一章绪论华东师范大学硕士论文3Arnold(1983)定义了P(IV)(It,叽1,a),其分布函数为Fx(z)=(1十(掣)l/v)~,z>芦,Q,">oFeller(1971)定义了一个Pareto分布,称为Feller―Pareto分布.构造方法如下:{殳Y是标准Beta(7l,m)分布,令W=Y~一1.其密度函数为pl-(y)=(B(,y1,似))~y71_(1一g)Ⅶ一,0<Y<1,7l,能>0若7l=1,W是Lomax分布,Arnold(1983)指出p+d(y~一1)1足Feller―Pareto 的推广,若p=0该分布称为广义F分布,由Kalbfleisch和Prentice(1980)推出.§2研究内容有些人认为Pareto分布只不过是“变换的指数分布”,因此并不值得单独对它进行 研究分析.而实际上,Pareto分布族及与其相关的推广在社会科学、经济科学、环境科 学、保险精算学等诸多领域得到了广泛的应用并发挥了重要的作用.在保险精算学中, 保险的损失数据一般都是非负的,常常是不对称的,后尾的,这就给精算师们提示了选 择损失分布的方向,在目翦精算师常用的八种分布中有两种分布是来自Pareto分布族, Pareto分布族在保险精算学中的重要性由此可见. 本文首先对Pareto分布的发展历史作简要的回顾和总结,以便我们可以用发展、整 体的眼光来看问题.在本文的第二章,按照Parcto分布族内各个分布发展的先后顺序比 较系统地,比较完善地进行了介绍和研究,对各个分布的密度函数、分布函数、矩、众位 数、Fisher信息阵以及其它一些相关分布之间的相互推导、转化关系等性质进行r探讨 研究. 第三章介绍广义Pareto分布,该章足本文的研究重点,也是本文的重要创新之处.本 章主要包括回部分内容.第一部分主要是广义Pareto分布的基本性质,给出广义Pareto 分布的两种特殊形式,并对广义Pareto分布的数字特征进行研究.用图的形式描述了不 同参数取值对分布形状及位置的不同影响,当参数口取正整数时,采用数学归纳的方法推导出广义Pareto分布的分布函数,这是本文的创新点之一.第二部分主要是参数的估计,包括矩估计.极大似然估计、区间估计,以及基于正态逼近的一些推断.本文证明了矩估计和极大似然估计的同变性,这是本文的又一创新点.对次序统计量的部分相关性质也作了研究.第三部分主要研究假设检验,区间估计是一种参数的估计方法但同时也 是一种参数假设检验的方法,该部分对区间估计的检验方法进行了探讨.似然比方法是 很重要的一种假设检验方法。同样在本文中似然比检验方法发挥了其强大的威力.第四 部分也是率章的最后一部分,主要讨论了广义Pareto分布在实际中的应用,并通过棒球 运动员收入的例子和飓风损失的例子进行了说明. 第二章Pareto分布族在上一章的文献综述中我们已经大致r解1-Pareto分布族的发展历史,并知道Pareto分布族在经济学、金融学、环境科学以及保险精算学中都有很广泛的直用,在本章中我 们将对Parcto分布族的各个分布比较详细地作一一介绍.§2.1标准Pareto分布标准Pareto分布实际上是Parcto分布族其它的分布如Pareto(1)、Pareto(II)、 Parcto(III)、Paxeto(IV)、Feller―Pareto分布的一个特例,但是Pareto分布族中分布无法全部用标准Pareto分布的一个简单函数来表示,Feller―Pareto分布就不能用 标准Pareto分布的函数来表示,由此就决定了标准Parcto分布在Pareto分布族中的作用就不如标准正态分布在正态分布族中的作用那样重要. 定义2.1:若x的分布函数为Fk(。)=1一(1+。)一1,则称X为标准Pareto分布. 其密度函数为z>0出)2高砰若x来自标准Pareto分布,则X_1也是标准Pareto分布.§2.2Pareto(I)(a,&)分布该分布由Pareto提出,又称为Pearson(V1)分布.§2.2.1Pareto(I)(口,a)分布的定义定义2.2:若X的分布函数为F(z)=1一(;)~,x>o我们称X为Pareto(1)(a,o)分布. 第二章Paxeto分布族 §2.2.2华东师范大学硕士论文5Pareto(I)(口,o)分布的数字特征其d阶矩为:E(X6)=∥(1一&)~,期望为; 方差为:6<n众数为:mode(X)=玎§2.2.3y。r(x)=面前面E(x)=a(1一击)i1,a>1 。>2Pareto(I)分布的相关性质(1)若U―r(1,1)为标准指数分布随机变量,则X=口e:一P(联以a)(2)若X。,X2磐Pareto(1)(1,1),则P(x。+托>z)=;+―2logi(x一-I)z>2(3)若x…..,置,…足独立同为P(州l,o)分布的rv.,N~Possion(7),且与x…..,五,…独立,记Y=∑X,则l=1P(y>Y)一7Y―o其实这个结果并不依赖于N尾否足Possion分布,上式对任何取值为非负整数、期望为,y的rv.N都成立.(4)若x1,局,…,X。来自P(州口,D)的样本,令其次序统计量为x(?)≤x(2)≤…x(n),设如>‰定义Rk小,一毫等,则^2Rhb兰Ⅱ%】=h+l其中%一Jp(,)(1,d(n―J+1)).且P(Rkmm)=豁叫¨删IbIj=k14-1o的100(1―7)%的置信区间为m。>z)=∑。“m小”,j≠j(旦芑≯) l=klv岩)。+l。(5)若x-,恐,…,墨。独立同分布,X―P(,)(口,△).当口已知时,有loa(Xd,7)一r(t,。。),n∑I。9(置加)一r(n,1)'=1 第二章Pareto分布族华东师范大学硕士论文6其中:T=∑%I l。9(x。/口),当Q已知时,r∥2(n,1)是F(n,1)约o/2分位数. nalog(五n/a)^一r(1,1)O-的100(1―7)%置信区间为:[x(1)(7/2)1/(“…,x(1)(1―7//2)I/(““’]当J,口都未知时,.n占2五1)'&5e∑细(五/x(1))】_1(寺,a)是(口,a)的强相合估计,且a,a相互独立.且有弛a一1~r(n一1,i),7搬f口9(玎夕盘)~r(1,I)此时,(口,Q)的l000一,y)%置信域为:{(盯,。) acl<not<dG,5e一出/(M1<盯<寿e一出/(“8’)其中:q2d1=一log(q/2),q=1一川广=了F,/2(n一1,1),G=rl一∥2(n一1,1),dl…logo∥2),i=l,2,-一,n则Z=x。/五的密度函数为:(6)若:ri―P(,)(%.,皿)蹦牡{案鍪:,罴:一{寒al+a2t蓉瓣)广嚣≤分布,则二者的混合分布为Pareto(I)分布[见Maguire,Pea.t'sonand㈤(7)若X~尸(,)(七,o),当Y=x一1时,Y的密度函数为W(,)=aknⅣn~,0<Ⅳ<(8)Harris(1968)指出若x是参数为目的指数分布,0―1是取值范围从0开始的Beta wynn(1952)j.事实上,若P(X≤。f口)=1一e一2朋且卢=O-1服从Gamma分布P(卢)。寄 第二章Pareto分布族则华东师范大学硕士论文7跗≤z)=南Zoorle“朋(1--e-tx)出 =-一南J(。。rP啦妒1)dt 2卜石丽JcP1819”=1一(p。+1)一1§2.3Pareto(II)(#,仃,&)分布该分布由Pareto提出,是Pearson(VI)分布,又称为Lomax分布.Lomax用该分 布对商业失败数据进行分析.§2.3.1Pareto(II)(#,o-,n)分布的定义定义2.3:若X的分布函数为:脚)=?一(H孚)一z>舭>?我们称X为Pareto(II)(p,口,n)分布.§2.3.2Pareto(II)(/2,o-1&)分布的数字特征期望掣)=盟高必=南a>l众数:mode(X)=p§2.3.3方差:Vat(X)=E(x2)“2㈤=F褊Pareto(II)(#,J.oL)分布的相关性质d瓶跗弘煎≮擎业-i<5<ct(1)若x1,%,?.,,.k来自Pareto(1I)(#,吒d)的样本,则墨1)=min(Xl,.k,-,x。)是芦的相合估计,若假设以。已知,则X(O是卢的极大似然估计.(2)P(11)(O,口,ot)的Fisher信息矩阵为J=(意一甲1) 第二章Pareto分布族华东师范大学硕士论文8(3)若u~u(o,1)(卢一or)+,TU一1/。~P(,,)(p,dr,d) (4)若U―ro,1)为标准指数随机变量,则X=p十or(el一1)一P(,,)(肛,dr,&)§2.4§2.4.1Pareto(III)(/1,仃,7)分布Pareto(III)(p,or,1)分布的定义定义2.4:若X的分布函数为;F(z)=1一(1+(孚)矿。>咿>吣>o我们称X为Pareto(III)(#,or,7)分布.§2.4.2Pareto(III)(#,‘7)分布的数字特征一7―1<d<7―16阶矩:E(X6)=or6ro一16)r(1+"/5) 期望:E(X)=ar(1―7)r(1 4--f)一7-1<6<7_1众数;rnode(X)=p十口((1―7)/(1+,y)】1,,y<l§2.4.3Pareto(III)(p,or,7)分布的相关性质(1)若X来自标准Pareto分布,则Z=p+aX7~P(Jj州p,口,7). (2)若墨,恐,…,以来自P(III)(O,or,o),U-,巩A带,…,巩时来自U(01)的样本,UO)≤歇21≤…≤∥㈤为其次序缀计量,对k2>≈1有鼍㈦/X(¨兰[(u=¨。)/(∥3。+,)】,(3)P(III)(O,口,7)的Fisher信息矩阵为J=(孛毒)(4)若U―u(o,1),则卢+矿(矿一1―1)1~PffH)(#,口,7) 第二章Parcto分布族华东师范大学硕士论文9§2.5Pareto(IV)分布该分布有Arnold在1983年提出.§2.5.1pareto(IV)分布的定义定义2.5:若X的分布函数为:F(z)=1一(1十(孚)÷)一I O">帅>帅>o我们称x为Pareto(IV)分布.§2.5.2pareto(IV)分布的矩及其相关性质一'一1<6<了一17<1(1)E(x5)=盯6r(Q一76)r(1―76)(2)mode(X)=p+口[(1―7)/(o+7)】’,(3)xl,为独立,Xi―Parcto(W)(肚.口,7,口。)z=1,2则 min(X】,恐)~P(,y)∞,盯,71Ql+Ot2)(4k―a(p)几何分布,X/。一P(,n(p,o-,1,,o),则蹦>z)2萎矿1(1+(半)V“)1 =(1+(可m-#)1/1)。’.x―P(,Ⅳ)(卢,crp'Y,7)(5)xi,恐,…,墨。时来自P(1V)的样本,xtl),甄卧…,甄。)为莛相应的次序统计量.因为X(1)>z铮五>z 对所有i都成立.所以x1,x2,,一,xn~P(I L7)(p,口,1,a):争x(1)~P(,y)(“盯,7,nn) P(IV)(O,吒7,。)的Fisher信息矩阵为!f生i 1 2二业f!)±!j=1离1{15口(口+2J璺【i丛生二型12=!l兰±生f虫±业!(叫±!【生f生二生【!址中(D+2)妒(口)一p(1)一1’(五干币 第二章Pareto分布族华东师范大学硕士论文10§2.6§2.6.1Feller―Pareto分布Feller―Pareto分布的定义1971年,Feller用一种不同的方法定义了一个Pareto分布,Y―Beta(7l,72) /Y(y)5l暖而1Ⅳ”一1(1一g)“一1,o<Ⅳ<l对实数弘,玎>0,'>0,我们定义w=p+盯(y~一lP,W的分布为Felle卜Pareto分布,记为W―FP(“仃,7,71,72).其密度函数为如(卟丽1(半)恤n卜1(,十(孚)聊)’~m>卢Pareto(IV)(p,盯,7,01)=FP(p,or,7,a,1)当2"2=l时,Pareto(IV)与Feller―Pareto是一致的,即§2.6.2 众数Feller-Pareto分布的数字特征及其相关性质W~FP(芦,盯,7,7l,蚀),当,y≤"Y2时,mode(W)=灿+盯【(舰一')/(7l+7)11矩 若W^J FP(,u,or,7,71,,y2),W+=(W一弘)/口,贝4 W’一FP(O,1,m71,加)实际上,W’=(Y~一1),其中y―Beta('7t,m)下面计算d阶矩E(∥)=E[(Y-*-1∥1=Z1丽%(了I--y,,一6眇-1(1刊一曲:皇!!!二!至丝±!盟日(7l,加):!f21二!坐堕±型r(1?)r(m)一竺<J<卫7'E(W‘)=∑名。(;)矿一Jor’(r(7l―J7)r(m+j,y))/r(讯)r(他)女<7。HFP(“口,,y,,yt,12)分布,假定灿是已知的,不失一般性令卢=0,则FP(O,or,',7l,协) 的Fisher信息矩阵为 第二章Pareto分布族华东师范大学硕士论文11雕引其中猎)2一瓣]I札=143=一掣hl+121 ,黜=妒’(1也)一妒’(1 J+72) 其中,1】f,(d)=r’(n)/r(n),币’(n)=d’b(a)/da§2.7Pareto分布族各分布之间的关系其实Pareto(1),Pareto(II),Pareto(1lI)足Pareto(IV)的特殊形式 P(J)(盯,o)=P(,y)(盯,盯,,y,a) P(,,)(肛,口,Q)=P(,y)(卢,d,1,n)P(,』,)(p,口,7)=尸(,y)(p,口,%1)0?若x1,为,…,%是来自标准Pareto分布的样本,F(z)=1一(1+z)~,z> x(1)为第i个次序统计量,则五i)一FP(O,1,1,n一{+1,i).若Xl,尥,…,%来自P(,,,)(p,盯,7,n―i十l,i)=争墨,)~FP(I』,盯,,y,礼 第三章广义Pareto分布统汁学在社会、经济等领域的应用日益广泛,在保险精算学中也不例外.Parcto分 布在保险的损失数据分布的拟合中发挥着重要的作用,精算师们在工作实践中逐渐发现 有些损失数据用一种推广的Pareto分布来拟合效果会更好,由此就引起了统计学家对下 面要介绍的广义Pareto分布的研究兴趣,从而推动了广义Parcto分布的研究和应用.§3.1广义Pareto分布的基本性质§3.1.1广义Pareto分布的定义 若X的密度函数为pc功=黼煮斋出,=黼高藉…慨m,则称X服从广义Pareto分布,简记为CP分布。§3.1.2GP分布的特例当卢=1时,该广义Pareto分布的密度函数变为;人们通常用p=1时的分布来拟合数据.这时的Pareto分布仅有两个参数,计算简单. 但是,有的时候拟合情况欠佳,人们开始采用三参数的广义Pareto分布来拟合数据. 当A=l时,该广义Pareto分布的密度函数变为:出,=黼熹≥…江",这是广义Pareto分布的另一个特例,它实际上足Fisher Z分布族,简称为Z分布,记为z(Q,卢),其中a与卢是两个正参数.参数a的变化将导致Z分布密度函数形状的变化,当△≤l时,p(x)对严格递减函数;当n>1时,p(x)是单峰函数,且在精处达到最大值.本文主要研究广义Pareto分布的一般形式,它的一些特殊形式的性质可以由一般形式的性质来得到.12 第三章广义Pareto分布华东师范大学硕士沦文13参数向量(o,卢,A)的变化导致广义Parcto分布密度曲线的变化,下面给出了不同参数值下的广义Parcto(记为GP)分布的概率密度函数图像。图(3) 镰l章广义Pareto舟毒华东师范大学硕士}仑文14§3.2GP分布的分布函数随机变量的取值带有不确定性,要想元整地描述陋机变量的特祉,全向揭不随机受量取值的发生机制,探求随机想象客观存在的规律性,对分布函数的研究足很有必要的, 下面我们就用数学归纳方法来给出在p取正整数时广义Pareto随机变量的分布函数的 表达式. 当Z=I时,p(£):了羔,z>o,Q>o,A>o p(。)2iX-=F丽,z>o,o>o,A>o州垆一等等<。,肿)=J(‘群备虻-一(杰)。因此,当p=l时,p(x)为减函数。我们用R(£)来表示当芦=i时的分布函数,则当口=2时.p(z)=n(。+1)淼,z>。,口>。,A>。F2(£)=小a删斋斋 (一群鲁)卜Z‘群洁dz瞅,一高* ?一(圭)。(,十羔)当p=3时p(z)=14璺一=掣ix;;:每,z>。,n>。,a>。 第三章P-X Parero分布华东师范大学硕士论文15乃(£)=/ !i!±1211±兰2 2J0爻602(A 4-z)。+31=f一n(o 4-1)舻z22R(o)一(A 4-z)”2 n(&4-1)舻t2)I+JOOtOZc川,斋斋az=?一丽1(熹)(啦)+等南十帮(南)2)当p=4时,2(A 4-£)o+2,(z)=!』竺二三j±i!掣ixj;;;苫,z>。,。>。,A>。Ao一R(t)t坚堂≯幽 丙丽们&(o+1)(o 4-2)"z3 6(A 4-z)o+3 a(Q 4-1)陋+2)"t3 F3(t)一 6(A+£1a+3)卜上。1堕±!!!竺±!!―丝二 tI茁2(^+z)“3-一丽1(熹)。(啦)十耕南+帮(杰)2+帮(南)3肿)-l一丽1(熹)。(器+帮两t卜.+掣(击)卜1)由上述推导的分布函数可以看出,当卢=女时,广义Parcto分布的分布函数为下面采用数学归纳法对广义Paxeto分布的分布函数形式进行证明卢=1时,肿,=J(‘群籍dx=]-c击,。础)=l一丽1(南)。(鬻+耕丽t扣.+紫(南)“1)假设当p=k时, 当声一七+1时,密度函数为Aoz。 r(a+%+11 p(x1= r(o)r(七十1)(A+。)o+。+1 z>0.口>0.A>0 第三章 所以广义Pareto分布华东师范大学硕士论文16枷,=fOt粼南出 =(一志筹糌)I+Z。黼誊杀 L一碌丽万玎而两几十上承面两虿而 =踯卜丽1(熹)。(黼(南)‘)2=,一丽1(熹)。(踹+帮两t卜.+黼(南)‘)§3.3即㈦一志(熹)。(器+帮丽t扣-+端GP分布的矩估计§3.3.1由数学归纳法可以证明在p取正整数时,OP(a,口,A)的分布函数为GP分布的矩估计的计算z=EX=厂黼筹知血 2―可研矿“2 =等器铲a=当A。>, 弘。=脚=Z”黼煮鲁出pi1^o¨ynrx=日x2一(Ex)2=(£坚言群一!垫吝录料)a2r(Q1r、(p1p*=删=厂黼两Acla:(g一+k)-I妇 :―r(―o齐-弋k)ir(鬲fi-+k)舻“=等器铲牡器”…“… a>≈根据上述的各阶矩,我们可以有如下方法得到参数的矩估计设xH一,五。屉来自GP总体的一个样本。以脚记总体的r阶原点矩,m,记由X”一,虬得到的r阶样本原点矩,即 第三章广义Pareto分布华东师范大学硕士论文17舻删;m,一:壹W仨虢由下述方程式可解得(o,芦,^)占-{舒=躺A 【筮=躺A=|if p。=告A(3-31)(3删 (3删(3.2 4)段m出脚鹦瞄 铲铲(3 2.5)邮删得:卢=(糍哥一-)。将p代入(3.3,5)中解得:卢=(;蠢三{考)一1=石孬i笔号潍皇啦(芦。,芦。,芦。)铲一锩兰辨皇咖-脚肭)gl(m-,m。,m。)则a=面2。/q一/.t23卢-l十2#蕊;+1垒9,(芦t,弘。,脚)&=鬲而2。m―lm23。--;+2m而;+1-6s阳慕哥P=意毫意2篙籍292㈨m舢,2铲m-=篇慕篱毫静垒咖。,‰m。, 第三章 §3,3,2广义Parcto分布华东师范大学硕士论文18GP分布的矩佑计魄基本性质设x―GP(a,卢,A),x的密度函数为出,=黼煮鲁…!!!±旦现使X发生量纲变化,即X变为☆.X,记Y=≈?X,则Y的密度函数为咖,=黼器 即y…kXi:!!:!r(o)r(口)(南^+y)4+口G尸(n,阢从),参数乜,卢不变,A变为从,正好与白变量x发生了同级量纲变化.上述性质要求Ot,口,A的估计满足以下条件 a(xl,?一,x。)=&(kxl,,..,kx二)fl(xl,…,X。)=fl(kX¨一,%%)七A(x1,-??,.x。)=A(女.)f1,,??,七.xj) 这口q做估计的同变性,结合上述性质,我们对广义Pareto分布的矩估计进行观察发现,a一1的分子、分 母都是五的四次齐次多项式,这就意味着当置的量纲发生变化时,d一1估计值是不 变的,即不受自变量的量纲的影响.例如自变量取值由墨变为K+咒时,先后两次的参 数估计a是相同的.同理,母的分子、分母都是墨的五次齐次多项式,故卢是与自变量的量纲无关的参数估计.但A的情况就不同了。我们观察会发现^的分子部分是五的五次齐次多项式,而分母部分足置的四次齐次多项式,这样就导致^会和自变量x的取值发生同级量纲的变化.也就是说,广义Pareto分布的矩估计具有同变性.§3.3.3GP分布的矩估计的渐近正态性矩估计有两个基本特点.其一,矩估计基于经验分布函数,而经验分布函数逼近真实分布函数的前提条件是样本容量较大,因而理论上讲,矩方法是以大样本为对象的I 其二,矩方法没有用到总体分布的任何信息,本质上讲它是一种非参数方法,对已知的 总体分布来说,矩估计不一定是一个好的估计.虽然如此,人们一般不把矩方法完全当 成非参数方法,它在小样本场合也常得到应用.事实上,在许多场合,矩估计由许多优 良的性质。对一般情况下的矩估计,通常只能考虑它的大样本性质,下面的定理来自参 考文献『291’它们给出了矩估计的大样本性质,证明从略.定理3.1设置,尥,…,j‘为独立同分布变量序列,ElXlo<o。.记目=(口¨.,,吼)’,并设g是连续的,则矩估计日=g(mH-.,m。)是口的相台估计. 第三章广义Psxeto分布华东师范大学硕士论文n19定理3.2设x】’五,~,Xn为独立同分布变量序列。E(霸)=胁,m,=:∑碍,r=t=1L.,∥第行 ., ●,一/~¨扎,引、躺 则/,●\列 ?桃朊 \、● ●/素㈦卜,蹦一‰埚…。6;9∽ = 引 “,一.,叫为E的定理3.3设s维随机变量序列x-,x2,…,j‘,有渐近正态性佩k" ㈣E M.㈦一U引鲰m一∞心\、● /勘@曲/,l,●\i。~...在以*勾 中 0翡 一溅 , ●\内 连 续烟辫;舞i。~卜缀:瓣、,丽(g(x。)~9(p))三^‘(o,g’(p)E(9,(p))7)xl,恐,…,墨。是来自广义Pareto分布的样本,应用上述定理得到椎)其中rE3×3=, J●I ●、\一, r-●I ● 、\肛肛pi\ l三Ⅳ3(o,Es。。) \、● ● / )Ⅳ3一卢l肛2p4一pIp3、p5一p2芦3一2舻4一鹰芦5一肛2卢3芦№№一啊娜邮3卢6一p;/l9l(£1,t2,t3)=92(tl,t2,ta)=ga(tl,t2,t3)=意t2t3镪2t;t3 豢精+£l《一币i曩南¨ 意%惫¨tl如~2《+£:£2 第三章广义Pareto分布华东师范大学硕士论文20G。xa=∥c“,=(蒸蓑u#2蓑#3)其中却la弘1∞ld#2却l0似3===||―2p;p3―2p:“2芦3 4-4卢1卢2 (p1芦3―2,u1 4-p:芦2)2 4p】p2p3―2p21肛;一2卢:p3 (卢lp3―2卢;十卢:p2)2 ―2卢l卢j十2卢}“2 (plp3~2p;4-p21p2)2 ―2≠王2tp22弘3 4-4芦l芦2壤一2p;弘3 (卢2卢3十p2肛lp!一2卢j肛3)2 ―2plp22肛3十4肛:卢2“3―2芦2l卢; (芦2芦3十‘也芦lp;一2pjp3)2 ―2肛ip;十2pl/.t! (p2卢3 4-p2pl卢;一2p;卢3)2 6p】卢22p3―2詹“:一弘2l肛i一2p!一p2卢; (卢lp3―2p;+肛:p2)2||二!些i些!绝±苎!些;二!些;些!±些!苎;±!兰i苎!(p1弘3―2p;4-p;卢2)2 4p2lp;一2弘:p2―2,u2(pl卢3―2u;4-卢j卢?)2‰丽c砉=一(害=慨一弧‰~籼瓠一c砉=‰丽=因为mt三芦1,仉2三肛2,m3三脚,故将上述∑3×3,G3。3中的pl,,』2,№分别用估计 值ml,m2,m3代替得到∑3 x3j G3。3的估计值妻3‰岛。3,从而对广义Pareto分布大样 本性质有以下结论:所以而㈣(;)}三M(o,o妻07) )》 第三章广义Pareto分布华东师范大学硕士论文21§3.4§3.4.1极大似然估计的解法GP的极大似然估计X=(zl,z2,…,o。)是来自广义Parcto分布的12个样本其似然函数为L:高熹l其中 r(n+卢)B(a,卢)对数似然函数为=nLr(n)r(卢)= 一礼nB口卢+礼o n^十卢一 l。∑㈦忆Z―n+芦。∑㈦一< 十 Tf蒜一糊Ss川小鲫枷,) {品一糊+耋lTtxl--i赫=1 mt)【敲=警山州耋盎(a,声,支)由下述方程解得l蕊cgl=o雕f(o/yj叫卵)/y)/州卅)70t(棚o/Y)L+;(日“{))7021础(O/Y)k(0-0(i))+余项当日与刚很接近时,余项可忽略不计.上式的稳定点是下述方程021a(Op/2Y)l引.)(日一目(t’)=一ot(ao目/Y)1日(。) 第三章 的解.即广义Parcto分布华东师范大学硕士论文229=9(0-(翌::;:;!竺I a“,)一1、ozIaO/日Y).I。cl,)目(o)表示赋予a的初始值,刚表示第i次迭代的5的值,Ncwton-Raphson算法就是如下迭代式90+U=日({,+(一―a―2―@矿lY)1日“’)一1\a@a/日Y)1日【;’)常用的另一个迭代方程式为驴删圳+[E(一警I O)…’,九a@矿lV)…1,)/伊f∥f对于广义Parcto分布来说,伊f、__――学=【要零蒌821) \翮瓢研/a2fafa日扰虿筇扰孤―n娥。(a,卢)B(n,p)十n(联(a,卢))2B2(a。口1an2伊f―nB:。(a,卢)B(n,p)+扎B:(n,卢)B;(a,卢)B2(&,卢)nanl卵a2f aaaA一0、1^‘―√A+茁,一n―日%(a,卢)B(a,p)+n(睇(n,p))2B2(a,p)一nB。Ir。(a,卢)B(n,卢)+n或(口,卢)%(Q,卢)B2(&,卢)一一亡―L一筹小删善南=;一善n忐跳一拶张~溉{若一聊跳拼巩|批砒一坤:一÷―l_鲁A+戤鲁A+≈ 蒜三章广义Pareto舟布华东师范大学硕士论定23当伊+x)一目(i’J达到我们预先要求的精度时,选代终止,p‘’’即为所求参数向量的极大似然估计值.§3.4.2极大似然估计的基本性质X:(zl,&,…,z。)是来自广义Pareto(。,p,^)分布的n个样本,(a,声,i)是广义 Parcto分布的极大似然估计,则(矗,p,i)是下面似然方程的解小渤fA+甄)=0ln(^十z,)=0不难得出(a,声,≈天)是如下方程的解糍一脚两边国卧砒。∑譬∑Ⅻ 『势鼍矿m。∑㈦=O{一糊十量批矿静cⅢ训=o【警一(&十卢)蚤册1五2of一嚣辫删小酗(Ⅲ㈤=o§3.4.3极大似然估计基于正态的统计推断 §是口基于数据Y的极大似然估计。在一定条件下, (口一目)一Ⅳ(O,G)其中,C屉∞一目)的d×d维的协方差阵.(3.3.1)统计学家认为,8是固定的(尽管是未知的),而目是随机的。在目及模型给定时,上式表明在重复抽样时§是均值为e,协方差为C的正态分布.记s(o/Y)=型号铲,在一些正则条件下,L,(口)(日一日)≈s(o/r)其中,J(O)=E(塑;等挈旦I口)穰为期望Fisher信息阵.因此,够一口)≈s(o/Y).要注意的是J_1 f口)是渐进分布的方差,而不是精确分布的极限.在一定的正则条件下重复抽样,S(口lY)是渐近正态分布,期望为o,方差为了(8).从而得出(日一日)是期望为0,方差为C=j-1(口)的正态分布,并用p代入计算J_1(p)的值. 第三章广义Pareto分布华东师范大学硕士论文24Fisher信思阵1臣设x是密度函数为,e(?)的随机变量,其中0=(01,…,巩).Fisher信息阵i(o)是≈×k对称阵,其元素为k(e)=E…rglOg强fo(2)Olo强gfe(z)]i若密度函数,e(?)对所有t,』,锱都存在,则删=一岛(%铲]下面来计算广义Pareto分布的Fisher信息阵对于GP(A,oe,卢)分布,所有的二阶倒数都存在,记e=(日。,如,如)=(A,o,口)l(弩,(z)=(牟一1yog(z/X)一(口十p)}09(1十z/A)一logA+f口9r(u+卢)一logr(Ⅱ)一 logr(3)所需的二阶偏导为:―瓦百_。天~A1+z/Aa2logf(x111 l―百r02loof(x)2一再十1r矿丽nn+卢1O%M(z)―02―l万ogjfr(一x) a02―孤百矿一A―1+z―/A1 1= 一…~L王。V,一掣、u J 妒,(Q+p)一妒,(。)一y、L王。一7 ―02了lioo赢fj(广z):妒,(d+p) aa88其中,妒(n)=r’(n)/r(o),妒’(o)=d妒(a)/da,下面计算岛(e) 锦三章}L义Pareto分布华东师范大学硕士论文25厶1(0)=一厂[骂掣㈣az1,2(0)=,1。(e)=一-;(1-厂岛㈦=一南 一Z+。。.2。l。.g印f(z)。f(z)dz 衍。卷虹渤一Z+0。[望:;;:笋],(z)a。一f+。。[旦:;掣],(。)d。^。aAao”…”“§一学厂群t斋把 ^2^ (十z/^)2~一A2&+口A2(a+卢+1)122(e)=一J(+。02。1。。g叩f(x)。]f(。dz=-咖7(a十fi) ffz)dz=妒7(口)一妒’(a十p) 如s(e)=一Z+0。02l。叩gf(z)一qk(e)=所以GP的Fisher信息矩阵为即,:f焉窜似三寰p,襄, \渤一妒弘十p)妒")一∥缸十卢)Qf―』u"1t-pn~j基于正态逼近,口的lOOa%置信区问是(p~ZC…/,自+ZCl/2),在正态分布下,一Z到z的面积为1000r%。C为r1(O/r)或J一1(口).对于d维向量目来说,100n% 置信椭圆有以下式子给出 (口一目)rC_1(目一日)≤x2自由度为d的X2分布从0到x2的面积为lOOa%,由此来决定上式中X2的值.Efron和ttinkley(1978)讨论了r1和L,~1的相对优缺点,在某些情况1-1比J一1容易计算,因而受到大家更多的喜爱. 对于广义Pareto分布来说((a,口,A)一if,,声,^))一N(O,1-1(口/】,)) 镍三章广叉Parcto分布华东师范大学硕士论文26其中I-1(o/Y)=[-t(e)对于三维向量(口,p,^),lOOa%的置信椭球为((n,p,A)一(a,声,^))7,(o)((n,p,^)一(6,声,^))≤k自由度为3的x2分布从0到k的面积为lOOa%,由此确定上述不等式中的k.§3.5GP分布的次序统计量及次序统计量的分布定义设置,…,x。是来自某总体的一个样本,该样本的第i个次序统计量,记为五,它,娃如下的样本函数。每当该样本得到一组观测值。¨-.,z。时,将它们从小到达排列为■1)≤。(2)≤…≤x(。),其中第i个值。(。)就是五,)的观测值.称(x(1),…,x(。))为浚样本的次序统计量,次序统计量. x…称为该样本的最小次序统计量,x(。)称为该样本的最大蜀,…,五,是来自GP(a,序,A)的一个样本,其密度函数为p(o),分布函数为P(x).则x…的密度函数为g(Y)=nfl一F(Ⅳ)】”1p(Ⅳ)刮志(熹)“圭i=lx㈨的密度函数为r(n+i―1)r(i)(戋)】{_1黼者为=礼器器筹为(妻哞秽(煮)卜”)“g(y)=n咿(∥)】”1p(u)=(-一志(南)。(娄等产(煮)…))“黼誉为Xck)的密度函数为 第三章广义Pareto分布华东师范大学硕士论文279(可)ii二二―ij褊[F(g)】‘一1[1一F(Ⅳ)】“一kp(Ⅳ)n!志(t一志(高)。(量帮(☆)1。))‘ (志(南)“(娄≮铲(南)“))“r@+p)kr(n十p)A。Ⅳ口一1r(o)r(卢)(A+Ⅳ)n+口A(”‘+1)。护(蠢一1)!(n一砷l r(n)n一2一?r(z)(A+y)m一雨潞p(妻肄≯(南)“)“1))‘望r』L、r(i)\A十封/1--高(南)。(砉生存函数为 假设有t2>tl,则1),Y、1r(i)一Li丙/删叫…㈦叫T驯一即,=志(志)“委P(X>tdX>钔=嚣崭=l,A。=(∞。霸r(i鲁若x~GP(a,p,^),则y=x~1的密度函数为r(Ⅱ)LA+t2R―o=) 堕㈨。∑汹r(Q+i一1)r(i)f』L、卜1\A+t2/高(击。)娄≮铲(盎)“)、A十7 tl…、。娄≮产(熹)。1她)=黼一舻(:)肛1 1 n十;)”4Y211(a+p) 舻98―1 r(a)r(卢) (A+Ⅳ)”4 第三章广义Parcto分布华东师范大学硕士论文28即Y=X一1~GP(p,d,^)§3.6GP分布的假设检验何㈣(;)卜,鲫, ̄/箝(a―a)三U(0,奎11) ̄/丽(卢一声)三N(0,竞2,)P2P2“的1―2%置信区问为:陋一篇‘vi一{,矗+蔫Ⅳl一{]卢的1一☆%置信区间为^Dp 一M一^o一+M一;A的1一%%置信区间为^、^~“砬一面M整何M一^、^+“砬~面毽一扣 M一k一2Ⅳ1一!为标准正态分布1一§%分位数.对于如下分布的假设检验问题 风:样本来自一般的Pareto分布,H1:样本来自广义Pareto在本章的第一节中我们已经分析了Pareto分布和广义Pareto分布的区别:Pareto 分布是广义Pareto分布在卢=1时的特殊情况.那么对样本来自Pareto分市还是广义 Pareto分布的分布检验问题就转化为如下的参数检验问题‰:p=l,HI:p≠l用区间估计的观点来看就是:若原假设成立,声的区间估计就应该包含l在内,否则,拒绝原假设.同理对其它情况的单个参数的检验也都可以采用区间估计的方法,这 是一个简单实用的方法. 铬!章广足Pareto,舟布华东师范大学硕士论文29在§3.4.2中对极大似然估计进行基于正态逼近的研究得到如下结论,式中的记号同§3.4.2的记号,((。,p,A)一(a,卢,A))~N(O,i-l(O/y)) 其中,“(o/Y)=I‘1(e)0=(舀.卢,^)是(口,口,夫)的极大似然估计.针对单个参数情况如下:(Q―a)一N(0,,^’(e))(p一声)~N(0,,五1(6))(A―i)一N(0,坛1(6))故参数的区问估计如下:础(e)=揣 础e)=湍 础e)=揣a的l一≈%置信区间为:陋一五{Nl~§,a+,二{Nl―l卢的l一£%置信区闻为:∞一,i。N。一§、声十f斧Ⅳ,一§蛐々1一≈%置信区问为:A一坛:NI~§,^+瓦;Ⅳl一{同上,NI一;为标准正态分布l一;%分位数.§3.6.2似然比检验定理3?6[见参考文献291设样本X=(xl,…,j0)来自密度函数族p(z;日):0∈O,其中未知参数0=(日¨-.,ok),参数空间0是k维欧氏空间舻中的一个含有内点的集合,参数真值80是0的一个内点.假设该密度函数族满足以下四个条件:(1)正掣枇)=上铆忡)_o㈡川,…,%(2),(p)一(]ij(口))I。々>o,VO∈e,其中础)=Z(警)?、Oln鹄p(x;O),"1∞㈣忡)(3)存在M(x),使得£姘如),p(z;8)d弘(芏)<Ⅳ,V0∈e,其中K与9无关,且在含有参数真值岛的一个领域内,『锱J≤M枷,㈦,…,% 第三章广义Pareto分布华东师范大学硕士论文30(4)不同的8值,对应着不同的概率分布.考虑原假设f毛:口∈eo对各择假设Ⅳ-:目芒eo,其中eo是e的一个子集'且满足下述条件:存在r(r<%)维欧氏空问口中的一个含有内点的集合A,以及定义在A上的k个三阶可导的函数g=(gl,…,鲰),使得A与e――对应,eo=(p:日=9(妒),妒∈A} 在参数真值日=9(妒)时,记p@:p)=p(z;9(cp))为乒(∞;妒).则分布族p(。;目):口∈00 可等价地写成(i(z;妒):妒∈A}的形式。假设密度函数族(F(¥;妒):妒∈A)满足上述四个条件.在口∈。时,假设口的ML即是似然方程宅萨=o的解,其中徊J|n。n㈨pZ口 II。∑㈦“茁p并且在n―o。时,口依概率收敛于参数真值80.在原假设为真,即参数真值%∈eo时,目的MLE目o=9(p。),假设p。足似然方程锣乎=o的解,其中虱p)=Inni(%妒)=∑f晒(%妒)并且在n一。o时,氏依概率收敛于参数真值妒。. 定义似然比统计量A=专L一 1-Ip(x;岛)则在原假设玩成立时,2ln&随11增大而依分布收敛于)(2(k―r). 证明:下面的讨论都是在原假设凰成立的条件下进行的,令Ⅱp(置;6)yc∞=击e喜掣,…,喜警)则由中心极限定理知,在n一∞时,V(Oo)与N(O,,‰))(3.6.1)i-1(岛)?V(eo)与D(Oo)有相同的极限分布,且仅差一个依概率收敛于0的量。 因为密度函数族{p(z;口):口∈eo)满足四个条件,则“ R2(∑z坤(墨:口)一∑f坤(置;如))与D(%)’.I(80).D(00)i=1t=l 第三章广义Pareto分布华东师范大学硕士论文3l从而n n2(∑f印(置;§)一∑lnp(Xi;%))与fy(岛)】’‘(f(岛)r1?v(eo)l=l t=l仅相差一个依概率收敛于0的量,它们有相同的极限分布.同理,因为密度函数族佃(z;妒):妒∈A)满足四个条件,所以nn2(∑tn声(X。;驴)一∑lnF(Xi;‰))与【U(‰)¨J(妒。)卜U(妒o)4=1 t=l仅相差一个依概率收敛于0的量,它们有相同的极限分布,其中uc妒,=击?c喜掣r喜掣,J(妒)=(如(妒)),×,其中令B(妒)=(BⅡ(妒)),。k,其中%∽)=掣.注意到O=g(妒),日。=9(妒。).从而有c,(妒o)=B(伽)?V(Oo)蜥)=Z(善n掣)(喜掣¨㈦洲出)J(妒o)=B(妒o)-I(00)一[B(_Po)】’(3.6.2)所以2(∑ln筘(X。ip)~∑2硒(置m))与Ⅳ(伽玎,f8(妒0)]’?f以伽)]~t B(伽)-y(咖)仅相差一个依概率收敛于0的量,它们有相同的极限分布.注意到p(z;Oo)=i(z;(po),从而有2M(x)=2(∑lnp(Xi;自一∑lnp(Xi;醣))l=1nl=1n=2(∑tnp(X。;6)一∑tnp(X|l;如))l=1nt=1n=2(∑fni(墨;p。)一∑f坤(五;咖)) 第三章广-;LPoxeto分布华东师范大学硕士论文32则21n)tIX)与[y(妒。)]7-{[,(%)】一1-[B(妒o)】’?[L,(妒o)]一1?B(’%))?y(妒o) 仅相差一个依概率收敛于0的量,它们有相同的极限分布.令w(o。)=【r(o。)】_{.voo)则由(3 6.1)式知,w(oo)三N(0,f),且2ln^(x)与【Ⅳ(%)j7,【j―G(醣)]’W(Oo) 有相同的极限分布,其中C(eo)=【』(妒。)]{,fB(_po)】7.[J(妒o)]~1.B(V。).【,(1p。)]{由(3 6.2)式知,,一coo)是幂等阵,且,一G(%)的秩为K―tr{a(Oo))=%一打{[J(fⅧ)】~?B(妒o)Ⅳ(妒o)】~-fB(妒o)]’)所以21nA(X)的极限分布为x2(%一r),定理证毕. 前面文章已经说明了parcto分布和广义Pareto分布的区别就是参数卢是否为1两个分布的似然比检验如下Ho:卢=1 Hl:p≠1一kA=爿―――~其中a:卢,^是f丧设成立,即卢{1时,o,卢,A的极大似然估计.a。,^。是麋i假设成立,即卢=1时,o,A的极大似然估计.np(x。;a,声,^)Ⅱp(x;面,k)t--锚在‰成立时,2tnA一妒(1).§3.6.3应用实例研究 例t.Arnold B.C,(1983)在其著作附录中给出了一个有代表性的数据例子,50名收入超过700,000美元的高尔夫球手,他们到1980年为止的收入数据如下(单位;美元):3581 2474 2202 1858 1829 1690 14331 184i00010661005 1001 965 944 912883841 825 820 816 814778753 746 729 712 7081684 16271537 15191410 13741338 12081 171 1109 1095 109210561051 1031 1016878871778771849 844769759 镣三章广义Pareto分布华东师范大学硕士论文33上述数据的直方图如下;图(4)矩估计a=31.5731,p=0.8415,A=17008对参数卢傲如下假设检验:/40,卢=1 由§3口一1.H。:口≠16.1中的GP分布参数的区同估计方法,计算得到p的7赡的区问估计为(o.3099,1.3731).该区间包含1作为内点,故我们有95%的把握认为原假设成立,即铡2文章的前面部分我们提到广义Pareto分布在保险精算学中有很广泛的应用,美国精算学会收集了1949―1980年之间发生飓风造成的损失的数据(只对造成的损失 超过l,000,000美元的飓风作记录).历时32年,造成的损失超过1,000,000美元的飓风 共发生过38次,飓风发生的年份及造成的损失情况如下表所示贴现因子折现损失删12 341 3652,730 3,082 4.466 6,766 7,123 10,562 14,474 15.351 16,9832.233 2 233 3.383 2.761 2 233 3.912 3.612 3.145 4,0855 6 7 8 9mn18.383 19,030觖瑚Ⅷ卿栅卿删㈣Ⅷ㈣娜一失∞ ∞ ∞; ;∞ ∞ ∞ 年均 碍坩均 珀垮m坶坞 份竹n订融能饥髂盯:宕嚣璐3.806 第三章广义Pareto分布华东师范大学硕士论文34损失14,720 7,900 13,500 22,697 12,000 8,300 13,000 10,450 12,500年份 贴现因子折现损失1974 1959 1971 1976 1964 t949 1959 1950 1954 1 719 3.685 2 233 1.486 25.304 29,112 30,146 33,727 40.596 41,409 47,905 49,397 52.6003.3834 989 3.685 4.727 4.208 1.855 1 090 3.383 4.085 2.966 3 841 1.148 1.611 2.028 3.383 3.621 3.612 2。551 4 208 4.208 2 421 l-148 3.27632,300 57.91123,OOO 25,200 34,800 32,200 122,07() 119.189 97,853 67,20019731980 1964 1955 1967 1957 1979 1975 1972 1964 1966 1961 1969 1954 1954 197059,917 63,12377.809 102.942 103 217 123.680 140,136192,013198,446 227.338 329,511_霎|他拈M:2坩"硌均加n船嚣孔弱 卯鹬约∞札32 33 34 35 36 37 3891,000100,000165,300 122,050361,200421,680 513,586 545,778129,700 309,950750.389 863,881 1,638,000752,510500,00019791965分别用Pareto分布和广义Paret。分布对飓风损失的数据进行拟合,参数估计如下 第三章广义Pareto分布华东师范大学硕士论文35分布Pare¥o参数估计 i=73,674、000一打lLMLEGPa:1.1569454 7】MLEa=2.8330l=862,660,000露=o.33292454.34从似然比检验的角度来看,对Pareto分布与广义Pareto分布的检验实际上就足对参数p做如下假设检验:Ho:口=1Ht:芦≠1由§3.6 2中的似然比检验方法,2lnA=2(-454 34一(-454.71))=o 74,x;9(1)=2.706,2fnA=0.74<磕9(1),因此不能拒绝原假设. 参考文献All ChaouchelJean-Nod Bemro,A statistical test procedure for the shape pm'ameter ofgenei alized Pareto distribution Computational Statistics&Data Analysisa45(2004)787-803Pulishing2]ArnoldB.C.(1983).Paretodistribution.InternationalCo-operativeHouse,Fairland,MarylandArnold,B.C.,Laguna,L.,1977 On Generalized Pareto Distributions with Applicationsto In.come Data.International Studied in Eeononlies,Moaomics,Monograph#10,Department of Economies,Iowa State University,Ames,IA. Atushi Ishikawa,Pareto law and Pareto index in the income distribution of Japaese compa-nics Physica A349(2005)597-608,of sufficiencyBartlettM.S(1937)Propertiesandstatistical testsProc.R Soc.,LondonA,160:268-282.BoyanDimitrov,EfartvonCollani,VontorteduniformandPare0。distribu-tions.Statistics&probability Letters23(1995)157-164Financesand Socio-Economic Surney71Central Bank of Ceylon,ReportOllConsumer1981/82Sri Lan"ka,Statistics Department,Colombo,1984【8】 Chambers,J.M.(1977)Computational Methods [9】Constantinos Petropoulosin the multivariatefor DataAnalysis.Wiley,NewYork.and StavrosKourouklis,Improved estimation ofextielne quantilesLomax(Pareto 11)distribution.Mctrika(2004)60:15―24to ProbabilityFeller,W?,1971tionAn Introduction YorkTheory and Its Application,V01.2、2nd Edi。Wiley,New111Hewitt,Charles c.andsuraneeLefkowitz,Benjamin(1979)MethDds ofFitting Distributi。nstoIn.Loss Data.Proceedins of the Casualty Actuarial Society,66,139―160 参考文献 12]Hogg,Roberted华东师范大学硕士论文V,and Craig,Allen37T,(1978).IntroductiontoMathematical Statistics,4thMacmillan,New York.V.andTanis,Elliot13lHogg,RobertA(1983)ProbabilitymadStatisticalInference,2ndcd.Macmillan,New York.14】Hsiaw-ChanYch,Some properties and characterizations for gcncrafized multivariate Paretodistributions.Journal of Multivariate Analysis88(2004)47-60of Statistical Sci―15】J.K Ord,in:G.P.Patil,S.Kotz,J.K.Ord(Eds),Encycylopedia enccs,V01.4,Wiley,New 16JYork,PP.27-34Johnson N.L.,Kota s&Baiakrishnan cd.NewN.0994).contiauousunivariate distributions,l,2ndYork:Wiley.17】Khalafs SuKan,Mohamed E.Moshref,Record values ffonl generalized Pareto distrbutionand associatedinference.Metrika(2000)51:105一l 16Loss18】Klugman,S A.,Panjer,H.H.,Willmot,G.E.,1998sions.Wiley,NewYorkof PointModels:FromDatatoDeci―19]Lchmann,E.L,1983,TheoryWaxtsworth,1991)EstimationWiley,NewYork(TransferredtO20】MartinA.‰ncr,1993,T00b for Statistical InferenceTests In R.V.Hogg,Ed.、Studiedin21】Moore,D S.(1978).Chi-SquaresStatis―ties,V01.19,Mathematical Association of AmericatWashington,D C.PP 453―46322】G.SHI,nVATKINSON,C.M.SELLARS andtoC.W.ANDERSON.Applicationof the generalizcd Pareto distributionthe estimation of the size of the maximum inclusion in cleaIlsteels Acta mater.Vol 47,No.5,PP.1455―1468,1999231 P,McCullagh,J.A,Nelder,GeneralizedHall,London,1989LinearModels,2ndEdition、Chapman&24]Settling,R.J.,1980Approximation Theorems of Mathematical StatisticsWiley,NewYork. 参考文献 p51 WiLks,S.S.(t93s).The华东师范大学硕士论文38Large-Sample Distribution of the Likelihood Ratio for Testing Corn-posite Hypotheses.Annals ofMathematical Statistics,9,60―62Statistics26】Wilks,S.S(1962)Mathematical p7】WilliamWiley,NewYorkextension,Physica AJ.Reed,The Pareto law of Incomes―an explanation anda11319(2003)469-486. [28】Vytara.sBrazauskas,Fisher information matrix fortheFcller―Paretodistribu―tion Statistics&probability Letters59(2002)159―167f29】高等数理统计,茆诗松、王静龙、濮晓龙,施普林格出版社、高等教育出版社,1998盈30J概率论与数理统计,魏宗舒,高等教育出版社,1982年 px】Pareto分布的统计分析,李海芬,2004年 致谢华东师范大学硕士论文39致谢本文是在王静龙教授的悉心指导下完成的,在此对王老师表示衷心的感谢.感谢王 老师在学习上和生活上对我无微不至的关怀.王老师严谨的科研态度、认真的治学作风 和宽厚待人的品德对我的影响甚深.我不仅学习了很多专业知识,而且积累了宝贵的人 生经验.我将终身受益与此. 感谢茆诗松老师、汪荣明老师、濮晓龙老师、郑伟安老师、周纪芗老师等等,感谢它 们对我知识的传授.同时感谢卞正庆、祝红、付秋妹、许亚萍、杨晓燕老师在这三年中对 我的关怀与照顾.此外感谢资料室的马国选、糜奇明、谷口老师在资料查找方面给予的帮助. 感谢三年的室友、挚友李艳,学习上和生活上的无数次交流给我留下了深刻的印象,对我的成长有很大的帮助.同时感谢李艳的电脑,使我能够顺和地完成毕业论文的撰写 以及诸多程序的运行.感谢我的父亲和母亲,是他们在家乡的支持和自小以来的言传身教使我可以专心学习并且最终完成学业.感谢我的弟弟,长期对我的支持和鼓励,使我在遇到困难的时候不灰心. 最后感谢所有帮助过我的老师和同学们. 广义Pareto分布作者: 学位授予单位: 南新艳 华东师范大学参考文献(32条) 1.参考文献 2.Ali Chaouche.Jean-Noel Bacro A statistical test procedure for the shape parameter of a generalized Pareto distribution 2004 3.Arnold B C Pareto distribution 1983 4.Arnold B C.Laguna L On Generalized Pareto Distributions with Applications to In come Data.International Studied in Economics,Monomics,Monograph #10 1977 5.Atushi Ishikawa Pareto law and Pareto index in the income distribution of Japaese compa nies 2005 6.Bartlett M S Properties of sufficiency and statistical tests 1937 7.Boyan Dimitrov.Elart von Collani Vontorted uniform and Pareto distribu tions 1995 8.Central Bank of Ceylon Report on Consumer Finances and Socio-Economic Surney 1981/82 Sri Lanka 1984 9.Chambers J M Computational Methods for Data Analysis 1977 10.Constantinos Petropoulos.Stavros Kourouklis Improved estimation of extreme quantiles in the multivariate Lomax(Pareto Ⅱ)distribution 2004 11.Feller W An Introduction to Probability Theory and Its Application 1971 12.Hewitt Charles C.Lefkowitz Benjamin Methods of Fitting Distributions to In surance Loss Data 1979 13.Hogg Robert V.Craig Allen T Introduction to Mathematical Statistics 1978 14.Hogg Robert V.Tanis Elliot A Probability and Statistical Inference 1983 15.Hsiaw-Chan Yeh Some properties and characterizations for generalized multivariate Pareto distributions[外文期刊] 2004 16.J K Ord 查看详情 17.Johnson N L.Kota S.Balakrishnan N continuous univariate distributions 1994 18.Khalaf S Sultan.Mohamed E Moshref Record values from generalized Pareto distrbution and associated inference 2000 19.Klugman S A.Panjer H H.Willmot G E Loss Models:From Data to Deci sions 1998 20.Lehmann E L Theory of Point Estimation 1983 21.Martin A Tanner Tools for Statistical Inference 1993 22.Moore D S Chi-Squares Tests 1978 23.G SHI.H V ATKINSON.C M SELLARS.C.W.ANDERSON Application of the gener alized Pareto distribution to the estimation of the size of the maximum inclusion in clean steels .P McCullagh.J A Nelder Generalized Linear Models 1989 25.Serfling R J Approximation Theorems of Mathematical Statistics 1980 26.Wilks S S The Large-Sample Distribution of the Likelihood Ratio for Testing Com posite Hypotheses 1938 27.Wilks S S Mathematical Statistics 1962 28.William J Reed The Pareto law of lncomes-an explanation and an extension 2003 29.Vytaras Brazauskas Fisher information matrix for the Feller-Pareto distribu tion 2002 30.茆诗松.王静龙.濮晓龙 高等数理统计 1998 31.魏宗舒 概率论与数理统计 1982 32.李海芬 Pareto分布的统计分析 2004本文链接:http://d..cn/Thesis_Y739686.aspx
更多搜索:
All rights reserved Powered by
文档资料库内容来自网络,如有侵犯请联系客服。

我要回帖

更多关于 pareto分布密度函数 的文章

 

随机推荐