投影寻踪 matlab模型第一步为什么是归一化

(window.slotbydup=window.slotbydup || []).push({
id: '2014386',
container: s,
size: '234,60',
display: 'inlay-fix'
&&|&&0次下载&&|&&总6页&&|
您的计算机尚未安装Flash,点击安装&
阅读已结束,如需下载到电脑,请使用积分()
下载:5积分
3人评价1页
15人评价27页
2人评价24页
0人评价26页
1人评价8页
所需积分:(友情提示:大部分文档均可免费预览!下载之前请务必先预览阅读,以免误下载造成积分浪费!)
(多个标签用逗号分隔)
文不对题,内容与标题介绍不符
广告内容或内容过于简单
文档乱码或无法正常显示
文档内容侵权
已存在相同文档
不属于经济管理类文档
源文档损坏或加密
若此文档涉嫌侵害了您的权利,请参照说明。
我要评价:
下载:5积分查看: 3770|回复: 3|关注: 0
基于人工鱼群算法的投影寻踪模型通用MATLAB源码
<h1 style="color:# 麦片财富积分
新手, 积分 7, 距离下一级还需 43 积分
关注者: 5
投影寻踪模型常与遗传算法相结合,用于分类和综合评价,这里给出了一种基于蚁群算法的投影寻踪模型通用MATLAB程序,本源码由GreenSim团队原创,转载请注明,有意购买源码或代写相关程序,请与GreenSim团队联系(主页.cn/greensim)。
function [BESTX,BESTY,ALLX,ALLY]=FSOUCP(K,N,V,Delta,L,LB,UB,D,Alpha)
%% 此函数实现人工鱼群算法,用于求解投影寻踪分类模型
% GreenSim团队原创作品,转载请注明
% GreenSim团队主页:.cn/greensim
% 欢迎访问GreenSim——算法仿真团队→
%% 输入参数列表
% K& && &&&迭代次数
% N& && &&&鱼群规模
% V& && &&&人工鱼的感知范围
% Delta& & 拥挤程度的判决门限,取值0~1之间
% L& && &&&觅食行为的试探次数
% LB& && & 决策变量的下界,M×1的向量
% UB& && & 决策变量的上界,M×1的向量
% D& && &&&样本指标矩阵,n×p的矩阵,每一行为一个样本
% Alpha& & 窗口半径系数,典型取值0.1
%% 输出参数列表
% BESTX& & K×1细胞结构,每一个元素是M×1向量,记录每一代的最优人工鱼的状态
% BESTY& & K×1矩阵,记录每一代的最优人工鱼的评价函数值
% ALLX& &&&K×1细胞结构,每一个元素是M×N矩阵,记录每一代人工鱼的位置
% ALLY& &&&K×N矩阵,记录每一代人工鱼的评价函数值
%% 测试函数设置
% 测试函数用单独的子函数编写好,在子函数FIT.m中修改要调用的测试函数名即可
% 注意:决策变量的下界LB和上界UB,要与测试函数保持一致
%% 参考设置
%[BESTX,BESTY,ALLX,ALLY]=FSOUCP(50,30,0.5,0.3,20,LB,UB)
%% 第一步:
M=length(LB);%决策变量的个数
%蚁群位置初始化
X=zeros(M,N);
& & x=unifrnd(LB(i),UB(i),1,N);
& & X(i,:)=x;
%输出变量初始化
ALLX=cell(K,1);%细胞结构,每一个元素是M×N矩阵,记录每一代的个体
ALLY=zeros(K,N);%K×N矩阵,记录每一代评价函数值
BESTX=cell(K,1);%细胞结构,每一个元素是M×1向量,记录每一代的最优个体
BESTY=zeros(K,1);%K×1矩阵,记录每一代的最优个体的评价函数值
k=1;%迭代计数器初始化
%% 第二步:迭代过程
while k&=K
& & NewX=zeros(M,N);
& & NewY=zeros(1,N);
& & for n=1:N
& && &&&x=X(:,n);
& && &&&Xnb=AFneighbour(n,X,V);
& && &&&NN=size(Xnb,2);
& && &&&if NN==0
& && && && &xx=AFprey(x,V,L,LB,UB,D,Alpha);
& && &&&elseif NN&=3
& && && && &xx=AFswarm(x,Xnb,N,Delta,V,L,LB,UB,D,Alpha);
& && &&&else
& && && && &xx=AFprey(x,V,L,LB,UB,D,Alpha);
& && &&&end
& && &&&NewX(:,n)=
& & for n=1:N
& && &&&NewY(n)=FIT(NewX(:,n),D,Alpha);
& & X=NewX;
& & Y=NewY;
& & ALLX{k}=X;
& & ALLY(k,:)=Y;
& & pos=find(Y==minY);
& & BESTXk=X(:,pos(1));
& & b=sqrt(sum(BESTXk.^2));
& & BESTXk=BESTXk/b;
& & BESTX{k}=BESTXk;
& & BESTY(k)=minY;
& & disp(k);
& & k=k+1;
BESTY2=BESTY;
BESTX2=BESTX;
& & TempY=BESTY(1:k);
& & minTempY=min(TempY);
& & posY=find(TempY==minTempY);
& & BESTY2(k)=minTempY;
& & BESTX2{k}=BESTX{posY(1)};
BESTY=BESTY2;
BESTX=BESTX2;
plot(BESTY,'-ko','MarkerEdgeColor','k','MarkerFaceColor','k','MarkerSize',2)
ylabel('函数值')
xlabel('迭代次数')
function Qa=Project_Pursuit(X,a,Alpha)
%% 投影寻踪模型
%% 输入参数列表
% X& && & 洪水样本指标矩阵,n×p的矩阵,每一行为一个样本,
%& && && &Xij表示第i次洪水第j洪水指标,X是否已经归一化均可
% a& && & 投影向量,1×p的矩阵,元素取值范围-1~1,要求其元素平方和等于1
% Alpha& &窗口半径系数,典型取值0.1
%% 输出参数列表
% Qa& && &投影指标函数
%% 第零步:对a的预处理
b=sqrt(sum(a.^2));
%% 第一步:归一化处理
[n,p]=size(X);
x=zeros(n,p);
Xjmax=max(X);
Xjmin=min(X);
& & x(i,:)=(X(i,:)-Xjmin)./(Xjmax-Xjmin);
%% 第二步:构造投影指标值
Z=zeros(n,1);
& & Z(i)=sum(a.*x(i,:));
%% 第三步:计算投影指标函数
meanZ=mean(Z);
R=Alpha*Sa;%窗口半径
& & for k=1:n
& && &&&rik=abs(Z(i)-Z(k));
& && &&&if R&rik
& && && && &Da=Da+
& && &&&end
欢迎访问GreenSim团队主页:.cn/greensim
欢迎访问GreenSim——算法仿真团队→
<h1 style="color:# 麦片财富积分
支持一下。。。
<h1 style="color:# 麦片财富积分
上面的代码到底能不能运行,有没有人试过。怎么练嵌套都没有呢。我都看不出哪是主程序
<h1 style="color:# 麦片财富积分
站长推荐 /2
基于模型设计的需求管理和验证
MATLAB中文论坛是全球最大的 MATLAB & Simulink 中文社区。用户免费注册会员后,即可下载代码,讨论问题,请教资深用户及结识书籍作者。立即注册加入我们吧!
MATLAB官方社交平台
MATLAB中文论坛微社区将这种新思想与传统的回归分析、聚类分析、判别分析;(二)投影寻踪聚类模型;设第i个样本第j个指标为xij(i?1,2,?,;(1)样本指标数据归一化:由于各指标的量纲不尽相;值;(2)线性投影:所谓投影实质上就是从不同的角度去;a(a1,a2,?,am),计算其投影指标的大小;解为最优投影方向;若(a1,a2,?,am)为m维单位向量,则样本;mzi??aj
将这种新思想与传统的回归分析、聚类分析、判别分析、时序分析和主分量分析等相结合,会产生很多新的分析方法。例如投影寻踪聚类(Projection Pursuit Classification,简称PPC),它是以每一类内具有相对大的密集度,而各类之间具有相对大的散开度为目标来寻找最优一维投影方向,并根据相应的综合投影特征值对样本进行综合分析评价。 (二)投影寻踪聚类模型 设第i个样本第j个指标为xij(i?1,2,?,n;j?1,2,?,m),n为样本个数,m为指标个数,用投影寻踪技术建立投影寻踪聚类模型的步骤如下: (1)样本指标数据归一化:由于各指标的量纲不尽相同或数值范围相差较大,因此,在建模之前对数据进行归一化处理为x'?xijijxjmax,其中xjmax表示第j个指标的样本最大值。 (2)线性投影:所谓投影实质上就是从不同的角度去观察数据,寻找最能充分挖掘数据特征的作为最优投影方向。可在单位超球面中随机抽取若干个初始投影方向a(a1,a2,?,am),计算其投影指标的大小,根据指标选大的原则,最后确定最大指标对应的解为最优投影方向。 若(a1,a2,?,am)为m维单位向量,则样本i在一维线性空间的投影特征值zi的表达为mzi??aj?1jxij。 '(3)寻找目标函数:综合投影指标值时,要求投影值zi的散布特征应为:局部投影点尽可能密集,最好凝聚成若干个点团,而在整体上投影点团之间尽可能散开。故可将目标函数Q(a)定义为类间距离s(a)与类内密度d(a)的乘积,即Q(s)?s(a)?d(a)。 n2类间距离用样本序列的投影特征值方差计算,s(a)?[?(zi?za)i?1n]12。其中za为序列{z(i)i?1,2,?,n}的均值,s(a)愈大,散布愈开。 nnik设投影特征值间的距离rij?zi?zk(i,k?1,2,?,n),则d(a)???(R?ri?1k?1)f(R?rik),f(t)?1为一阶单位阶跃函数,t?0时,其值为1;t?0时,其值为0。在此f(R?rik)???0R?rikR?rik,R为估计局部散点密度的窗宽参数,按宽度内至少包括一个散点的原则选定,其取值与样本数据结构有关,可基本确定它的合理取值范围为rmax?R?2m,其中,rmax?max(rik)(i,k?1,2,?,n)。类内密度d(a)愈大,分类愈显著。 (4)优化投影方向:由上述分析可知,当Q(a)取得最大值时所对应的投影方向就是所要寻找的最优投影方向。因此,寻找最优投影方向的问题可转化为下列优化问题: ?maxQ(a)?s(a)?d(a)?m,这是以aj2?a??aj?1?j?1?为优化变量的复杂非线性优化问题,可采用遗传算法等优化方法求解。 (5)综合评价聚类分析:根据最优投影方向,便可计算反映各评价指标综合信息的投影特征值zi的差异水平,以zi的差异水平对样本群进行聚类分析。
五、遗传算法 (一)定义 遗传算法(Genetic Algorithm,简称GA)以生物进化过程为背景,模拟生物进化的步骤,将繁殖、杂交、变异、竞争和选择等概念引入到算法中,通过维持一组可行解,并通过对可行解的重新组合,改进可行解在多维空间内的移动轨迹或趋向,最终走向最优解。它克服了传统优化方法容易陷入局部极值的缺点,是一种全局优化算法。其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。 (二)运算过程 1. 遗传算法染色体编码 遗传算法不能直接处理问题空间的参数,必须把它们转换成遗传空间的由基因按一定结构组成的染色体或个体,这一转换操作就叫做编码。二进值编码是目前遗传算法中最常用的编码方法。即是由二进值字符集{0, 1}产生通常的0, 1字符串来表示问题空间的候选解。 2. 适应度函数 遗传算法的适应度函数也叫评价函数,是用来判断群体中的个体的优劣程度的指标,它是根据所求问题的目标函数来进行评估的。遗传算法在搜索进化过程中一般不需要其他外部信息,仅用评估函数来评估个体或解的优劣,并作为以后遗传操作的依据。由于遗传算法中,适应度函数要比较排序并在此基础上计算选择概率,所以适应度函数的值要取正值。由此可见,将目标函数映射成求最大值形式且函数值非负的适应度函数是必要的。 在具体应用中,适应度函数的设计要结合求解问题本身的要求而定。适应度函数设计直接影响到遗传算法的性能。 3. 遗传算子 3.1. 选择 选择算子有时又称为再生算子。选择的目的是把优化的个体(或解)直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。选择操作是建立在群体中个体的适应度评估基础上的,目前常用的选择算子有以下几种:适应度比例方法、随机遍历抽样法、局部选择法、局部选择法。 其中轮盘赌选择法 是最简单也是最常用的选择方法。在该方法中,各个个体的选择概率和其适应度值成比例。设群体大小为n,其中个体i的适应度为fi,则i 被选择的概率Pi,n为遗传算法 Pi?f?j?1fi 显然,概率反映了个体i的适应度在整个群体的个体适应度总和中所占的比例。个体适应度越大,其被选择的概率就越高,反之亦然。计算出群体中各个个体的选择概率后,为了选择交配个体,需要进行多轮选择。每一轮产生一个[0,1]之间均匀随机数,将该随机数作为选择指针来确定被选个体。个体被选后,可随机地组成交配对,以供后面的交叉操作。 3.2 交叉 在自然界生物进化过程中起核心作用的是生物遗传基因的重组(加上变异)。遗传算法中起核心作用的是遗传操作的交叉算子。所谓交叉是指把两个父代个体的部分结构加以替换重组而生成新个体的操作。通过交叉,遗传算法的搜索能力得以飞跃提高。 交叉算子根据交叉率将种群中的两个个体随机地交换某些基因,能够产生新的基因组合,期望将有益基因组合在一起。根据编码表示方法的不同,可以有以下的算法:
a)实值重组
1)离散重组;2)中间重组; 3)线性重组; 4)扩展线性重组。
b)二进制交叉
1)单点交叉; 2)多点交叉; 3)均匀交叉; 4)洗牌交叉; 5)缩小代理交叉 常用的交叉算子为单点交叉。具体操作是:在个体串中随机设定一个交叉点,实行交叉时,该点前或后的两个个体的部分结构进行互换,并生成两个新个体。下面给出了单点交叉的一个例子: 个体A:1 0 0 1 ↑1 1 1 → 1 0 0 1 0 0 0 新个体
个体B:0 0 1 1 ↑0 0 0 → 0 0 1 1 1 1 1 新个体 3.3. 变异 变异算子的基本内容是对群体的个体串的某些基因座上的基因值变动。基于字符集{0,1}的二值码串而言,变异操作就是把某些基因座上的基因值取反,即1→0或0→1。 一般来说,变异算子操作的基本步骤如下: (1)在群体中所有个体的码串范围内随机地确定基因座。 (2)以事先设定的变异概率Pm来对这些基因座的基因值进行变异。 遗传算法引入变异的目的有两个:一是使遗传算法具有局部的随机搜索能力。当遗传算法通过交叉算子已接近最优解领域时,利用变异算子的这种局部随机搜索能力可以加速向最优解收敛。显然,此种情况下的变异概率应取较小值,否则接近最优解的积木块会因变异而遭到破坏。二是使遗传算法可维持群体多样性,以防止出现未成熟收敛现象。此时收敛概率应取较大值。 4. 迭代终止 当遗传算法已经寻找到最优的投影方向或者迭代次数已经达到预先设定的次数时,算法迭代终止,这时所返回的值即为本次寻优过程所得到最优的投影方向。 六、实证分析 本文应用投影寻踪聚类模型对上市公司的股价的高低进行分析,所选的盈利指标是每股现金流量和每股收益、每股净资产、股东收益率、净资产收益率、总资产收益率、销售利润率、主营业务收益率等等。把每股收益、每股净资产、净资产收益率这三个指标作为聚类的标准。其中: 净资产利润率=净利润/平均净资产(平均股东权益); 每股收益=净利润/期末总股本; 每股净资产=期末净资产/期末总股本。 样本股票的指标数据来自于华夏证券网公布的深圳2003年中期上市公司财务指标(如下表:原始股票样本数据表) 原始股票样本数据表 序 号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 股票 代码 538 631 961 407 510 633 687 852 960 012 股票 简称 晨鸣纸业 云南白药 四环药业 蓝宝信息 大连国际 大连金牛 天水股份 胜利股份 沈阳机床 金路集团 粤美的 A 合金投资 茂化实华 保定天鹅 岳阳兴长 江钻股份 亚华种业 锡业股份 万科 A 南玻科控 每股收益 每股净 净资产收 益率% 8.83 11.54 7.43 2.73 1.18 1.35 0.62 2.36 1.25 6.53 5.06 7.49 5.49 2.7 1.85 4.59 3.09 1.86 4.83 4.6 总股本 (万股) 81.8 .96 53 58.88 18.23 92.2 80 00 90.4
67697.54 股东 人数
34 投影 特征值 1.7 0.16 0.2 0.2 0.83 1.52 0.34 0.65 0.68 1.62 分类 结果 1 2 3 3 4 4 4 4 4 3 2 3 3 3 4 3 3 3 2 3 摊薄(元) 资产(元) 0.39 0. 0. 0.05 0.016 0.053 0.03 0.09 0.24 0. 0.088 0.042 0. 0. 0.14 4.45 2.82 1.53 3.22 2.29 3.5 2.57 2.25 2.31 1.36 4.77 1.59 2.04 3.24 2.27 2.43 4.02 3.29 3.1 2.95
将样本指标数据代入投影寻踪模型,其中n=20,m=5,给定R?rmax?3,由于模型比较麻烦在此不予给出。通过模型运算得到最优投影方向向量根据投影方向向量值的大小可知,每股收益、a?(0.36,0.18,0.15169)。5净资产收益率是影响分类结果的主要因素。同时可以利用zi??aj?1jxij(i?1,2,?,20)计算各个样本的投影特征值。根据股票样本的投影特征值的大小,将20支股票分为4类,投影特征值越大说明对应的股票投资价值越大。分类结果如下: 第1类:晨鸣纸业。这类股票是明显的高收益的绩优股,发展前景令人期待,投资价值比较大。 第2类:云南白药,粤美的A,万科A共有3支股票。这类股票有较好的发展态势,但盲目介入有一定风险,投资者可适当关注,择机介入。 第3类:四环药业,兰宝信息,金路集团等共有10支股票。这类股票业绩一般,操作上以回避为主,不过也可能有反弹空间,故还是以观望为主。 第4类:大连国际,大连金牛,天水股份等共有6支股票。这类股票是明显的低收益的绩差股,投资上还是以回避为好。 七、结语 PP的最显著特点是克服了高维点稀分布所造成的“维数祸根”困难,是对传统证实性数据分析思维方法的突破。其次,它使用了降维手段,当维数较高时,数据结构常表现在几个投影方向上。PP法正好能找出反映数据结构的投影方向,而排除了那些与结构无关的投影方向上的数据的干扰作用,因此,它能有效地发现高维数值的结构和特征。再次,由于PP采用了探索性数据分析方法,与传统的证实性数据分析思维方法法相比,它在处理数据时,无须人为假定,不会损失大量有用的偏态信息,能自动找出数据内在规律,因此稳健性较好。
参考文献 [1]P.J. Huber,Projection Pursuit,Ann.Stasties.1985;
[2]成平,李国英投影寻踪―一类新兴的统计方法,应用概率统计,1986; [3]J.H. Friedman, W.Stuetzle, A.SehLroeder,Projection Pursuit Density Estimation,J.Amer.Stat.Assoe.1984 [4]张健,两类探索性PP指标,应用概率统计,1993; [5]宋立新,成平,投影寻踪回归逼近的均方收敛性,应用概率统计,1996;
[6]田铮,戎海武,PPR的收敛性及全向攻击导弹数据处理,应用概率统计,1993; 三亿文库包含各类专业文献、中学教育、应用写作文书、高等教育、幼儿教育、小学教育、各类资格考试、外语学习资料、17投影寻踪模型等内容。 
 投影寻踪方法及应用内容摘要: 内容摘要:本文从投影寻踪的研究背景出发,给出了投影寻踪的定义和投影指标,在 此基础上得出了投影寻踪聚类模型,随后简单介绍了遗传算法...  投影寻踪 遗传算法MATLAB程序_机械/仪表_工程科技_专业资料 暂无评价|0人阅读|0次下载|举报文档 投影寻踪 遗传算法MATLAB程序_机械/仪表_工程科技_专业资料。clc ...  需要指出的 是,投影寻踪回归与单指针半参数回归模型的思想基本上一样,基本算法也差不多,差别大的 方面是收敛结果及证明。若论出现时间,投影寻踪回归较早,在 1989...  龙源期刊网 .cn 基于投影寻踪的图书馆评估模型及其应用 作者:李美文 林玉蕊 来源:《中国中医药图书情报》2014 年第 05 期 摘要:本文将...  投影寻踪回归的国际油价走势拟合 国际油价走势拟合模型 基于 IGARCH 投影寻踪回归的国际油价走势拟合模型王吉培 1 肖宏伟 2 (1.西南财经大学统计学院, 成都, 610074...  上述算法同样可优化 SVM 分类模型学习参数。 其他模型参数优化以上算法同时可用于优化投影寻踪模型(PP)最佳投影方向、BP 神经网络 权阈值、递归神经网络(Elman)权阈值...  18基于遗传算法(粒子群算法、人工鱼群算法等)的投影寻踪模型MATLAB源代码_工程科技_专业资料。投影寻踪是一种处理多因素复杂问题的统计方法,其基本思路是将高维数据...  投影寻踪方法在工程环境影响评价中的应用 【摘要】目前我们在工程环境影响评价的...不过,随着社会 的不断发展, 工程环境模型结构也逐渐的复杂化,这就使得人们在...【图文】投影寻踪方法及其应用_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
投影寻踪方法及其应用
大小:388.50KB
登录百度文库,专享文档复制特权,财富值每天免费拿!
你可能喜欢君,已阅读到文档的结尾了呢~~
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
投影寻踪聚类模型应用步骤
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='/DocinViewer-4.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口

我要回帖

更多关于 投影寻踪 matlab程序 的文章

 

随机推荐