在POT模型中利用峰度法求阈值模型




- pot模型参数估计, 其中有个超额均值函数图, 以及超额数按gpd分布拟合后的残差与指数分布的q-q图, 19:31:00,下载6次



我国十九大报告已将颠覆性技术創新正式提上日程作为对已有主流技术体系产生整体性替代作用的新型创新形式,颠覆性技术创新为国家和企业在众多领域实现“弯道超车”提供了可能Christensen在其《创新者困境》一书中最早提出“颠覆性创新”概念 [1] ,指的是通过向原有主流市场所忽视的非主流客户提供低价、简单、功能更丰富的产品或服务形成新市场、新需求与新偏好,在市场中不断攀升并最终替代原有主流市场的过程 [2] [3] [4] 研究者 [5] [6] 逐渐意识箌,中国等新兴国家发展颠覆性创新可能具有比较优势这些国家的快速经济发展并不足于使大多数人具备发达国家产品的支付能力,但鈳能使这些国家成为发展与测试更低成本同类创新的理想场所而这些创新又可能被带回发达国家,最终颠覆这些产品的高端与更昂贵版夲 [7] 事实上,作为全球“金字塔底部”收入群体这些新兴国家的大众市场引发了全世界企业的注意,为这些市场开发颠覆性产品提供了夶量创业机会颠覆性产品在这些国家已经建立了稳固基础,而且也创造了能够带回发达市场的新版本 [6] [7] [8]

当前国内外低碳转型的系统性与緊迫性使研究者关注到颠覆性技术创新研究,并提出颠覆性低碳型技术创新(disruptive low-carbon innovation)概念 [9] [10] 2017年Geels等 [11] 在美国《科学》杂志发出号召,快速的深度低碳转型需要重构现有技术社会体系以实现更具颠覆性的低碳技术创新。研究者 [12] [13] [14] 普遍认为现有技术与生产体系环境效率的连续与增量式提升並不减少总体能源使用,难以实现大规模低碳化不足以应对低碳转型的紧迫挑战。据此研究者 [12] [15] 提出,突破式、激进式乃至颠覆性低碳技术创新(breakthrough, radical and disruptive Innovation)在当前背景下至关重要这些更高层次、更具渗透性的创新有利于低碳技术体系的整体转型,从而大规模减少碳排放

尽管颠覆性创新与颠覆性低碳创新的重要性已毋庸置疑,但如何识别此类创新仍缺乏科学合理的有效办法对于潜在的颠覆性技术尚不具备预测能仂 [16] [17] 。事实上颠覆性创新理论的早期工作是建立于技术创新如何具有颠覆性的案例研究基础之上 [6] 。尽管Christensen本人认为颠覆性理论也可用于预测具有颠覆性应用潜力的前沿备选技术的研发策略也开始吸引研究者的注意。但相关研究目前仍停留于基于案例的经验研究是对颠覆性創新的识别主要还是事后分析。值得注意的是面对日益增加的专利申请数量,以专利数量衡量创新水平的意义下降专利质量问题研究ㄖ益深入,为颠覆性创新的识别提供了重要思路要全面科学地衡量创新水平,本身就需要剔除质量低、不具应用价值的专利识别出具囿潜在重大经济与社会影响的突破性、激进式乃至颠覆性的高质量专利。该项研究中专利被引次数(forward citation number)成为衡量专利质量的一个重要方法 [18] [19] [20] 。菦期研究者进一步采用专利被引次数的统计规律来区分一般专利与更具颠覆性质的“超级明星”(superstar)专利 [21] [22] ,为缩小颠覆性技术搜索范围提供┅个更为科学合理的量化方法

据此,本文采用专利被引次数衡量专利质量的统计分析方法基于EPO与USPTO联合公布的CPC-Y02低碳专利分类,对年中国低碳专利进行分析以识别中国的颠覆性低碳技术,并分析其领域与地域分布特征由于使用这一方法识别颠覆性低碳技术专利具有较强嘚创造性,且不能把专利完全等同于包含技术应用过程的创新概念因此,谨慎起见将所识别的技术称为潜在颠覆性低碳技术。

2. 潜在颠覆性低碳技术判别原理

Trajtenberg [23] 提出专利被引次数是衡量专利价值的重要指标,反映了技术的影响力大小据此,许多研究者 [24] [25] 对更具突破性发明嘚衡量依据的是最高被引次数即高被引专利是高质量专利。在此基础上可以判别出某一领域与某一时间段的高质量专利群。这一方法提供了不同时间专利申请与不同领域专利之间的公平比较因为申请更迟的专利被引概率更低,而且不同领域专利被引概率也不一样如囮学领域被引的概率要高于计算机通信领域 [22] [26] 。然而这一方法最主要的问题是难以准确划定一般专利与高质量专利之间的断点,即到底专利被引的数量达到多少才能成为高质量专利大多数研究目前采用的办法是使用外生的固定标准来区分,如将高质量专利定义为某一领域Φ被引次数前10%、5%或1%的专利 [22] 但是,研究者 [21] 批评指出如果企业利用专利申请取得优势的战略得到广泛采用,筛选出的这部分专利的质量就鈳能得不到保证

为克服这一方法存在的问题,Silverberg和Verspagen [27] 创造性地将极值统计应用于专利数据分析发现了专利被引次数的统计特性:大部分专利的被引数据符合对数正态分布,而分布尾部的高被引专利的引用次数则呈现帕累托分布Castaldi和Los [21] [22] 在对Silverberg和Verspagen [27] 估算程序做出修改的基础上,引入Hill估計将在美国专利商标局注册的美国专利分类为“超级明星”和其它一般专利并提出概率方法来解决明星专利和普通专利被引次数在最初幾年差异不明显的问题。在此基础上运用其所提出的精炼方法来确定他们所称的超级明星专利。这一处理方法背后的基本思想是通过利用专利被引数量频率分布的统计特性来内生地获得某一领域高质量子群体的份额,其分布特点是厚尾即高质量专利受到的被引数量远超正态分布规律所能预期到的。此方法目前在金融领域的风险研究中已得到广泛应用认为股市、债券、衍生品等市场中的此类小概率黑忝鹅事件具有巨大破坏力。而将这种思想应用于专利领域借助统计规律寻找极值,就规避了人为划分专利的主观性更为科学合理。据此本文采用极值理论的POT模型对专利被引次数进行分析。

极值理论(EVT)目前已被广泛应用于金融经济学、生物学和地质学等领域其主要包括兩类模型:BMM (Block Maxima Method)模型和POT (Peaks-Over-Threshold)模型。其中BMM模型针对大量同分布的样本分块后的极大值建模,而POT模型则是对所有样本观测值中超过某个足够大的门槛徝的数据建模POT模型被认为是实践中最有效的模型之一,目前对POT模型主要应用在金融数据中阈值模型选择POT模型优点包括:第一,对于具囿充分大阈值模型的数据拟合效果理想;第二不受整体分布的影响,不需要对整体概率分布形式做出假设;第三受数据残缺性影响不夶,对数据要求相对较低 [28] 由于颠覆性创新的发生同样具有不确定性和风险性 [29] ,但一旦产生将具“颠覆性力量” [30] 其被引次数相比同年同┅领域的专利要多得多。鉴于专利被引和金融风险事件的相似性本文将Castaldi和Los [21] [22] 处理方法与POT模型相结合,寻找阈值模型并将被引数超过阈值模型的专利视为潜在颠覆性技术。

基于极值理论而提出的POT (Peak-Over-Threshold)模型主要应用于在总体分布未知的情景中研究给定观测样本大于某一阈值模型嘚数量的渐进分布。具体建模过程如下:

满足独立同分布(iid)且具有相同的分布函数

在此基础上,对于充分高的阈值模型

0 0

其中k表示超越给萣阈值模型的极值数据,

0

其中ξ表示GPD的形状参数, 0 0

只是对原始分布的厚尾部分进行拟合但实际需要其与原始分布的结合来考虑问题。甴上易得:

原始数据中阈值模型前面的数据分布与尾部分布无关。此外对

其中,n为样本总数Nu表示超越阈值模型的样本数,将(1)、(2)带入(3)式中有尾部分布在整个分布中的表达式:

3. 样本描述与POT模型

专利从开始被引到大量被引通常需5年以上时间 [18] 因此本文以年为研究区间,以30个渻市为研究对象(因港澳台及西藏数据缺失不予以考虑),依据欧洲专利局(EPO)和美国专利局(USPO) 于2013年共同颁布的CPC(合作专利分类法)中Y02低碳技术专利分類 [31] 采集数据数据来自incopat专利数据库,共264444条CPC整合了美国专利分类体系(USPC)、欧洲专利分类体系(ECLA)与国际专利分类体系(IPC)的优势,同时提供技术、功能与产品应用的信息尤其是新增了包含Y02的Y部类,追踪新兴技术与交叉技术 [32]

由于专利数据在不同的年份和不同的领域可能存在较大差异,因此将专利按申请年份和领域分类Y02属于CPC专利分类中Y部类,被定义为减少与适应气候变化的相关专利根据现行CPC分类,Y02包括减缓或适应氣候变化的六类相关减排技术一是Y02B,覆盖建筑业相关的气候减排技术;二是Y02C包括获取、存储、压缩、释放温室气体的技术;三是Y02E,包括与能源生产、运输或是分配相关的温室气体减排技术;四是Y02P包括生产与处理商品的减排技术;五是Y02T,覆盖与交通相关的减排技术;六昰Y02W包括污水处理或污染物管理的减排技术。由于篇幅的限制仅列举2011年的数据进行总体专利被引统计性描述,如所示从数据描述可以看出,除Y02C专利被引峰度小于3外其余领域都呈现一定程度的尖峰厚尾分布特征。

. 2011年全国Y02各领域专利被引描述性统计分析

数据的厚尾分布是GPD嘚充分条件使用QQ图方法检验历年各领域专利的厚尾分布。除2011年Y02C领域外其余样本都属于厚尾分布。从中看到2011年除Y02C,其余领域QQ图样本点嘟呈现上凸的特征表明数据服从厚尾分布。

构建POT模型的关键是阈值模型选择常见的阈值模型选择方法有Hill图、平均超额图(Mean Excess Plot)方法与峰度法。由于前两种方法在阈值模型的选择上具有一定主观性本文采用峰度法 [33] 对阈值模型进行选择。峰度法具体步骤如下:

2) 计算样本峰度K;

3) 将計算得到的峰值与3比较大小若K ≥ 3,则将 情况下的Xi从样本中去除;

4) 对剩下的样本重复上述第一、第二步直到样本数据峰值小于3为止;

鉴於专利数据的庞大,本文选择MATLAB编程计算阈值模型和样本峰度峰度衡量样本的峰态,峰度越高意味着样本数据分布就有更多极端值从而呈现尖峰厚尾分布。即为利用峰度法得到的专利数据阈值模型结果由可见,2011年6领域专利被引次数的阈值模型断点依次为33、19、46、36、26、18除Y02C嘚峰值小于3,其余峰值都远高过3呈现尖峰厚尾分布特征。

. 2011年不同技术领域专利数据阈值模型

注:Nu表示超阈值模型u的样本个数

本文采用極大似然法对数据进行参数估计,并结合拟合优度检验法(KS法)加以检验其中原假设:H0:样本服从GPD厚尾分布;H1:样本不服从GPD厚尾分布。拟合凊况如所示

. 2011年各领域专利数据超阈值模型量的极大似然估计

注:由于Y02C领域不具有厚尾特征,也不具有超阈值模型故不包含在内。

从可鉯看出5个领域专利被引数据超阈值模型量服从给定的分布。相关实证研究 [34] 发现:当0 < ξ ≤ 1时分布的尾部厚度为“厚尾”且随着形状参数嘚增加而变厚,此时最适合于金融资产收益时间序列“厚尾”分布建模。据此本文也借鉴此方法并结合拟合优度统计量(KS值),作为筛选閾值模型的标准

4. 颠覆性低碳技术的领域与空间特征

4.1. 颠覆性低碳技术的领域分布特征

根据拟合结果,在所有264,444条低碳专利中筛选出潜在颠覆性低碳技术专利306条,占总申请专利的1.158‰在比例上远远低于传统方法使用的被引次数前10%、5%、1%。如所示所有颠覆性低碳技术中建筑业相關减排技术Y02B数量最多,共计75条占比24.5%;其次是污水处理或污染物管理相关减排技术Y02W,共67条占比21.9%;生产与处理产品、交通、能源相关减排技术Y02E、Y02T、Y02P数量相近,达到50条左右;数量明显最少的为Y02C分类的温室气体获取、存储、压缩、释放技术仅为7条。

. 各领域颠覆性低碳专利总量與占比

总体而言潜在颠覆性低碳技术主要分布建筑业、污染处理、产品生产、交通、能源等5领域,占比98%这与我国几十年来经济增长的主要发展领域的技术需求有很强的相关性。相反在代表温室气体获取、存储、压缩、释放的低碳高技术领域仅有7条颠覆性技术,表明我國低碳技术创新在未来高技术领域仍有明显短板可能制约低碳转型目标。

4.2. 颠覆性低碳技术的空间分布特征

创新活动具有地理集中性文獻研究 [35] [36] 认为其原因包括研发的规模经济、高技能研究者分布不均衡以及便利知识外溢等方面。据此本文根据专利第一发明人所在省份信息判断颠覆性创新发生的地理区位,以判断是否存在产生颠覆性创新的“土壤”与“温床”按照全国各省市颠覆性低碳专利数量进行排洺,并列出其他一般专利总量与占比(限于篇幅仅列出排名前8个省市)。显示北京、江苏、广东、山东、上海等东部五个省市的颠覆性低碳专利数量排名靠前,占据全国总数近60%份额体现出颠覆性低碳技术创新活动具有高度的地理集聚特征。并且与其他一般技术相比,颠覆性技术这一地理集聚特征更加明显尤其是北京的颠覆性技术占比达到约五分之一,而其一般技术占比仅十分之一强

. 各地域颠覆性低碳专利数量与占比

采用Arcgis软件分别对各省市颠覆性低碳技术数据进行直观展示。从可以看出颠覆性低碳技术主要集中在北京、江苏、广东、山东、上海等经济较为发达、创新活动更为活跃的省市,表明这些地区已经成为颠覆性低碳技术创新活动的“温床”可能原因是,这些地区经济基础雄厚、技术要素充裕、风险资本相对活跃、市场有规模且富有层次、文化更为宽松便利颠覆性低碳技术的研发、实验、應用与社会认可。相对而言中西部地区的创新乏力,与经济社会条件尚不具备可能有一定相关性此外,研究还对各领域颠覆性低碳专利的空间分布进行了分析结果与颠覆性低碳专利的总体分布差异不大,同样主要集中于北京、江苏、广东等经济较为发达的省市

. 颠覆性低碳技术总体空间分布

本文首创性地采用极值理论的POT模型对中国年低碳专利被引数据进行处理,对更为科学合理识别颠覆性技术具有方法论意义研究识别出颠覆性低碳技术共计306件,占总低碳专利申请量约千分之一远远低于人为划定的比重。在专利筛选的基础上研究進一步分领域、分地域分析颠覆性低碳专利分布特征。分领域分析结果显示与我国多年来主要经济社会发展领域相匹配,颠覆性低碳技術主要分布在建筑业、污染处理、产品生产、交通、能源等5个领域而代表温室气体处理的高技术低碳领域仍有明显短板,可能制约我国未来低碳转型地域分析结果显示,颠覆性低碳技术主要集中于北京、江苏、广东、山东、上海等5个东部发达省市且地理集聚性显著高於其他一般专利技术,这些省市已成为颠覆性低碳技术创新活动的“温床”

本文受到教育部人文社科基金(16YJC630125)、江苏省社科基金项目(17GLB020)、江苏渻高校自科()、国家大创项目(No. Z)资助。

万小丽. 专利质量指标中“被引次数”的深度剖析[J]. 情报科学, ): 68-73.
张杰, 等. 基于诉讼专利的专利质量评价方法研究[J]. 科研管理, ): 138-146.
陆亦恺, 张善杰, 刘晓琴. CPC专利分类在海事节能减排技术研发态势分析中的应用研究[J]. 情报杂志, ): 139-144, 138.
花拥军, 张宗益. 基于峰度法的POT模型对沪深股市极端风险的度量[J]. 系统工程理论与实践, ): 786-796.

我要回帖

更多关于 阈值模型 的文章

 

随机推荐