在进行效度影响因素分析时两种因素抽取的方法都需要吗

面相 | 海贼王 | 牙齿矫正 | 徐州市 | 虚拟专用服务器 | Windows 7 | 疤痕修复 | 方言 | 幼儿教育 | 英文歌曲 | 武术 | 餐饮 | 口臭 | 冬奥会 | 化疗 | 汽车音响 | 休学 | 片尾 | 骨折 | 电子技术研发 | 胃炎 | 姓氏 | 过敏性鼻炎 | 房贷 | 身高 | 加湿器 | 雅马哈 | 金平区 | 马鞍山市 | 取名 | 美杜莎 | 韩国 | 饮食 | 怀集县 | 牙套 | 古琴 | 语言学习 | 坦克 | 体检 | 冠心病 | 书籍 | 寺庙 | 美国电影 | 驾驶经验 | 寓言 | 学术 | 坐月子 | 日语语法 | 山东艺术学院 | 类风湿 | 手相 | 乳腺癌 | 运动损伤 | 自卑 | 房山 | 辩论赛 | 机械键盘 | 大学专业选择 | 塑料制品 | 护发 | 眼袋 | 肺癌 | 血型 | 玄幻小说 | 华为路由器 | 温州市 | 留学香港 | 大学生就业 | 大学生创业 | 城市规划 | 美术生 | 一体机 | 率土之滨 | r（编程语言） | 发音 | 记忆力 | 散光 | 互联网公司 | 西班牙语 | 口腔溃疡 | 汉语 | 观后感 | 留学生 | 参考文献 | 印度 | 中耳炎 | 澳门特别行政区 | 近视手术 | 尧山 | 荨麻疹 | 花卉 | 特许加盟 | 烹饪学校 | 设计院 | 岳阳县 | 婴儿喂养 | 痛风 | 营销策划 | 狐臭 | 失眠 | 眼科学 | 药品 | 欧美 | 弱视 | 童年 | 丙肝 | 合生元 | 男生 | 材料 | 中央戏剧学院 | 葡萄酒 | 网络推广 | 胃痛 | 酒文化 | 脱发 | 情绪管理 | 花样姐姐 | 示波器 | 胶原蛋白 | 痤疮 | 自驾游 | 孩子 | 马克思主义哲学 | 大学就读体验 | 美国留学 | 本科毕业论文 | 白内障 | 精神分裂症 | 在线教育 | 无线耳机 | 发动机 | win8 | 桥梁 | 非洲 | 婚恋网站 | 驾驶技术 | 敏感皮肤 | 学车 | 武昌区 | 整形 | 红酒 | 语言学 | Android手机 | 拉丁舞 | 猪肉 | 大学军训 | 高效学习 | 手绘 | 法国 | 刑事案件 | 胃病 | 牙科医院 | 宁夏回族自治区 | 邳州市 | 国家 | 口红 | 尿毒症 | 时间管理 | 事业单位考试 | 迅雷（软件） | 中国科学技术大学 | 康佳 | 西装 | 蓝河 | 肺气肿 | 地黄 | 外貌 | 高中化学 | 励志故事 | 小吃 | 关节炎 | 驻马店市 | 鲁迅美术学院 | 交警 | 发电 | 皮肤保养 | 文玩 | 轮胎 | 山东工艺美术学院 | 钢笔 | 食道癌 | 校服 | 酵素 | 日本漫画 | 非典 | 服装行业 | 数控车床 | 毕业论文 | 蓝莓 | 七田真 | 配方奶粉 | 头痛 | 枸杞 | 孕妇装 | 儿童 | 婴儿车 | 西医 | 本田（honda） | 研究生导师 | 美白 |

你的位置：网站首页 >> 频道首页 >>理工学科 >>在进行效度影响因素分析时两种因素抽取的方法都需要吗

在进行效度影响因素分析时两种因素抽取的方法都需要吗

来源：蜘蛛抓取(WebSpider) 时间：2017-06-26 04:54 标签：什么是效度影响因素

关注今日：4 | 主题：191219
微信扫一扫
【求助】关于做信效度分析时取样本量的问题
页码直达：
这个帖子发布于8年零256天前，其中的信息可能已发生改变或有所发展。
我要设计一个问卷，最后要做信、效度分析，准备分析重测信度和表面效度，请问一般是选取多大的样本量?
不知道邀请谁？试试他们
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
丁香园准中级站友
先说权威的要求例数最少在200以上；第二，在作因子分析之前先做球形检验，必须大于0.7，方可以进行因子聚类分析。我最近帮他们做了个省课题写了个东西，用的就是这个！而且，前面的同志说“我的课题设计是用前后两次（相隔两周）量表分的重测信度及Cronbach′sα 内部一致性系数评价量表的信度。以该量表分数与其他常用同类量表分数之间的Pearson相关性评价其校标校度。检验手段会不会单薄一些？有没有这方面的标准？”，希望你注意一下你题目选择项目的分布问题，这个也必须讨论，如果是硕士问题不大，可以对付，如果是博士就不行了，另外你自己可以从期刊网上，或者心理科学上找，有这样的文章，我这里也有，就是事情太多！--------------------------------------------------------------------------------re：我正在做国外量表的翻译及信、校度检验的课题，但有一些问题没找到确定的答案，请各位高手帮我答疑。谈谈自己的看法。1、例数如何确定？例数的确定一般根据前人的文献或自己的预实验，一般来说如果作量表分析至少要上百例样本，你看的文献也证实这点。样本也不是越大越好，只要达到检验目的即可。2、检验手段是否足够？如果有总量表和各分量表，需检验它们之间的内部一致性。信度分析时，可同时采用联合检查法和重测法，前者可采取组内相关法（ICC），若项目较多，还应做奇偶条目总分的相关检验。因子分析时，评估结构效度一般取极大方差正交旋转法，将量表的各项组合成若干因子，评估因子方差的总贡献值需采用多元统计方法。另外如果是诊断量表，最好有国际公认的“金标准”评定方法作比较。另外国外量表的翻译需注意译本的检验，检验中译本是否与原文相符，常用的检验方法为回译法，想必楼主已经联系到量表的原著者。另外量表的版权一定要注意，尤其我国已经加入WTO后，防止卷入版权纠纷。--------------------------------------------------------------------------------量表评价大致从信度、效度和反应度三方面进行的：1信度指标：包括重测信度、分半信度和克朗巴赫系数（1）重测信度是相同量表前后两次测量同一批被访者量表得分的简单相关系数r，一般要求达到0.7以上。（2）分半信度是相同量表的调查项目分成两半，如分前后两个部分、按提问项目号的奇数和偶数分两个部分。计算两个部分得分的简单相关系数r，分半信度为R＝2r÷（1＋r）。（3）克朗巴赫系数你已经算得了，就不赘述了。2效度指标：包括内容效度、标准关联效度和结构效度。（1）内容效度一般通过专家评议打分。（2）标准关联效度是以一个公认有效的量表作为标准，检验新量表与标准量表测量结果的相关性，以两种量表测定得分的相关系数表示标准效度。（3）结构效度主要用证实性因子分析（CFA）评价。3反应度：指量表能测出不同对象、不同时间相应变化的能力。最近师姐做量表，所以学来的，比较肤浅，希望有用！另外例数确定是有公式的，但我不大在行，很多人也都像上面“冯特”先生那样确定，如果只是翻译量表200例足够。——————————————————————————————————————————————————感谢参与讨论，确实比较肤浅，本来不打算评分了，考虑一直积极参与各种讨论，还是……--------------------------------------------------------------------------------谢谢七主任一如既往的支持！也谢谢各位的精彩发言，收获很大，不胜感激！各位战友能否提供几本好的相关书籍？我课题中的量表原文及初译稿如下：&请问各位战友，如果是你做这个量表，你会怎么做？请具体到病例数、方法（如何评价信度、效度）、工具、预期结果。gwb70：第二，在作因子分析之前先做球形检验，必须大于0.7，方可以进行因子聚类分析。我最近帮他们做了个省课题写了个东西，用的就是这个希望你注意一下你题目选择项目的分布问题，这个也必须讨论，如果是硕士问题不大，可以对付，如果是博士就不行了我是翻译国外量表后检验国内版本，因子分析在国外已做过，我是否可以不做因子分析，而只做效标校度？shmu ：例数的确定一般根据前人的文献或自己的预实验如何通过预实验确定病例数？shmu ：另外国外量表的翻译需注意译本的检验，检验中译本是否与原文相符，常用的检验方法为回译法，想必楼主已经联系到量表的原著者。另外量表的版权一定要注意，尤其我国已经加入WTO后，防止卷入版权纠纷。回译工作已做，正在修改译文。至于版权，只是同作者进行了e-mail的联系，不知是否足够，还需要更正式的文件，如授权书之类的吗？以下是作者给我回信的相关部分：Thank you for your message. I would be delighted for you to translatethe SADQ.--------------------------------------------------------------------------------我这里有一篇文章也许对你的工作有些帮助。西方量表译本的评价和修订.doc (28.0k)--------------------------------------------------------------------------------好的书籍我推荐张明园主编，精神科评定量表手册，1998，第二版，湖南科学技术出版社，长沙。如何通过预实验确定病例数？你可以参考《医学统计学》，金丕焕，复旦大学出版社。具体你可能还要和流行病学专家讨论，尤其是做过流调工作的。考虑到你已经回译并联系作者，另外作者没有提到版权问题（作者有没有在正式发表的论文后附量表？），应该不会有这方面纠纷。如果作者申请版权保护，你一定要他亲笔签名的书面授权书。--------------------------------------------------------------------------------这些书籍很多，金俞的《心理测量》里面有详细的例子，华东出版社出版的，你可以去看！例数一般必须在200以上，我这里绝对说的是权威的答案！另外，翻译的量表，必须经过校对，再回译，比较最后一致后，才可以用！请你注意这些！谢谢认识冯特的lolaego --------------------------------------------------------------------------------1、re:例数如何确定？这个问题最好用合适的公式计算得到，才比较有说服力。你说是吗？公式在许多统计学书上都有，请选用合适你的。我做过一个研究某“疾病”发病率和相关因素的研究，使用的是估计总体率的样本含量计算公式：uα2π(1-π)/δ2（2表示平方，显示错误）。δ为误差，一般不超过文献找到的总体率×30％2.re:我是翻译国外量表后检验国内版本，因子分析在国外已做过，我是否可以不做因子分析，而只做效标校度？国外是用国外的资料做的因子分析，既然你要翻译成中文量表，自然要在国内做调查，必须用在国内调查得出的资料做结构效度分析（因子分析）得到的因子符合量表的设计初衷就可以说明量表的效度是好的。3.re:回译工作已做，正在修改译文。至于版权，只是同作者进行了e-mail的联系，不知是否足够，还需要更正式的文件，如授权书之类的吗？只要你和作者联系了，如果需要授权书，他会和你说得。一般学术上的使用不会多严格。————————————————————————————————————————————————————本版第4500贴，值得纪念，故标记一下！！！向5000贴进军！七叶草/13:31 screen.width-333)this.width=screen.width-333& width=459 height=55 title=&Click to view full 4500.JPG (459 X 55)& border=0 align=absmiddle&--------------------------------------------------------------------------------呵呵，深感荣幸！继续努力！--------------------------------------------------------------------------------re:例数如何确定？我作的课题就是研制一个心理量表，因此用到了信度效度等问题。关于例数如何确定，我看某心理学研究方法中写着，研究例数应是根据多因素分析样本量为自变量5－10倍的原则，但是我听一位资深的统计老师说应该是变量7-10倍，我想想办法达到后一标准最好了。--------------------------------------------------------------------------------“自变量”指的是什么？--------------------------------------------------------------------------------和自变量相应的是因变量，比如学生的学习成绩可能和他的努力，压力，IQ等等有关。在这个模型里努力，压力，IQ等可以对成绩起影响的因素就是自变量（常用X表示）；而成绩就是因变量了。--------------------------------------------------------------------------------changee99 wrote:我正在做国外量表的翻译及信、校度检验的课题，但有一些问题没找到确定的答案，请各位高手帮我答疑。1、例数如何确定？我看到的文献病例数都很多，一般在100以上，有没有规定的数字？从何而来？有没有计算公式确定病例数？自变量就是你要翻译的量表中的问题数目。比如SCL-90量表一共有90个问题，那你就要以90作为自变量数目，然后选择相应的例数。2、检验手段是否足够？我的课题设计是用前后两次（相隔两周）量表分的重测信度及Cronbach′sα 内部一致性系数评价量表的信度。以该量表分数与其他常用同类量表分数之间的Pearson相关性评价其校标校度。检验手段会不会单薄一些？有没有这方面的标准？重测信度的时间间隔选择要根据你的量表性质而定，测人格、智商、态度等的要求都不一样，不知道你是哪种？不知道你是否有分半信度的测量？效度方面：有了效标效度，还要请专家评分，计算内容效度比CVR，此外进行因子分析和证实性因子分析，看看构想（结构）效度如何。对于信度的质量问题，不同量表有不同要求，例如态度量表：质量低中高信度系数 0.47 0.79 0.98不知道你的是哪一类量表？告诉我，我可以帮你找找。--------------------------------------------------------------------------------一点补充：估计总体率公式：N=μα2 л(1-л)/δ2N为所需样本量，a有单双侧之分，μα为相应的正态分位数，δ为期望估计误差的最小值，当然是越小越好。估计总体均数公式：N=（μα·σ/δ）2N为所需样本量，a有单双侧之分，μα为相应的正态分位数，δ为期望估计误差的最小值，σ为总体标准差。有关心理学的书建议你看郭庆科编著孟庆茂审校的《心理测验的原理与应用》人民军医出版社。还有楼上推荐的张明园主编，精神科评定量表手册，1998，第二版，湖南科学技术出版社，长沙。--------------------------------------------------------------------------------请问如何判断国外量表是否适合中国人群呢？文化差异是否会影响量表的使用呢？如何解决呢？--------------------------------------------------------------------------------taotao168 wrote:请问如何判断国外量表是否适合中国人群呢？文化差异是否会影响量表的使用呢？如何解决呢？所以要做中国的人群常模啊，文化差异就要修订这个两表来符合中国人。不过我看到好多国外的两表即使修订了，那里的好多的问题也是晦涩的很，总是很饶脑筋。--------------------------------------------------------------------------------谈谈结构效度做结构效度一般要做两步，探索性因素分析和验证性因素分析，而且需要两个样本。如果某个量表德结构也十分确定，则直接做验证性因素分析即可。后者需要特别德软件，如LISREL， AMOS等。至于的人数（例子），一般比较容易找的，最好有350以上，有些样本属于特殊群体，100多也可以。--------------------------------------------------------------------------------我现在是想做课题了,想采用硕士论文的别人自编的量表,那这种科学性有多大,我还需要对它做什么样的评定呢 ?还有对心理量表的编制的话,有什么比较好的书本可以介绍一下吗 ?谢谢--------------------------------------------------------------------------------我也想知道。--------------------------------------------------------------------------------1。重测信度及Cronbach′sα 内部一致性系数这些检查只是形式上的，我从没没有不通过的2。这个样本要是建立在得常模的基础上，根据以往一些论文信息，估计方差会大，就样本大些。中国人的比较特殊，国外一些不一定适用，语言需要再三考虑，把对象视为没有文化的比较好3。你还想细致些作验证性因子分析，这个不一定是做效度的好工具。不同软件算法不一样，对样本要求不一样的。--------------------------------------------------------------------------------Rasch analyses will be conducted by the Rasch Unidimensional Measurement Models (RUMM2020) software based on the IRT. Initial analyses are based on traditional measurement theory or Classical Test Theory (CTT), whereas Rasch analyse is based on the IRT. Table 1 provides key differences between CTT and IRT models. Due to the limitations with the CTT with regards to sample and test dependencies, these variations make it nearly impossible to compare respondent scores across different measure. However, researchers such as Mc- Horney and Cohen demonstrate that linking instruments within the framework of IRT modelling can allow comparisons of instruments and respondents. The application of Rasch analyses based on the IRT can help to create more precise tools. Item and scale analysis within the framework of IRT will ensure reliable, valid, and accurate measurement of respondent trait levels. Identification of items that are informative or problematic can help investigators to understand the domain they are measuring as well as the population they measure.Table 1. Comparison between CTT and IRT modelsCTT
　　　　　　　　　　　　　　　 IRTMeasures of precision fixed for all scores
Precision measures vary across scoresLonger scales increase reliability
Shorter, targeted scales can be equally reliableTest properties are sample dependent
Test properties are sample freeMixed item formats lead to unbalanced impact on total test scores
Easily handles mixed item formatsComparing respondents requires parallel scales
Different scales can be placed on a common metricSummed scores are on ordinal scale
　　　　　　　Score on interval scale
　　　　　　　　　　　　　　　　　　　Graphical tools for item and scale analysis--------------------------------------------------------------------------------古典測驗理論的內涵，主要是以真實分數模式（亦即，觀察分數等於真實分數與誤差分數之和，數學公式為）為理論架構，依據弱勢假設(weak assumption)而來，其理論模式的發展已為時甚久，且發展得相當規模，所採用的計算公式簡單明瞭、淺顯易懂，適用於大多數的教育與心理測驗資料，以及社會科學資料的分析，為目前測驗學界使用與流通最廣的理論依據。　　然而，除上述各項優點外，古典測驗理論卻有下列諸項先天的缺失(Guion & Ironson, 1983; Wright, 1977)：古典測驗理論所採用的指標，諸如：難度(difficulty)、鑑別度(discrimination)、和信度(reliability)等，都是一種樣本依賴(sample dependent)的指標；也就是說，這些指標的獲得會因接受測驗的受試者樣本的不同而不同，因此，同一份試卷很難獲得一致的難度、鑑別度、或信度。古典測驗理論以一個相同的測量標準誤(standard error of measurement)，作為每位受試者的測量誤差指標，這種作法並沒有考慮受試者能力的個別差異，對高、低能力兩極端組的受試者而言，這種指標極為不合理且不準確，致使理論假設的適當性受到懷疑。古典測驗理論對於非複本(nonparallel)但功能相同的測驗所測得的分數間，無法提供有意義的比較，有意義的比較僅侷限於相同測驗的前後測分數或複本測驗分數之間。古典測驗理論對信度的假設，是建立在複本(parallel forms)測量的概念假設上，但是這種假設往往不存在於實際測驗情境裡。道理很簡單，因為不可能要求每位受試者接受同一份測驗無數次，而仍然假設每次測量間都彼此獨立不相關，況且，每一種測驗並不一定同時都有製作複本，因此複本測量的理論假設是行不通的，從方法學邏輯觀點而言，它的假設也是不合理的、矛盾的。古典測驗理論忽視受試者的試題反應組型(item response pattern)，認為原始得分相同的受試者，其能力必定一樣；其實不然，即使原始得分相同的受試者，其反應組型亦不見得會完全一致，因此，其能力估計值應該會有所不同。　　一般說來，為了克服古典測驗理論的缺失，才有當代測驗理論的誕生。當代測驗理論的內涵，主要是以試題反應理論為理論架構，依據強勢假設(strong assumptions)而來，其理論的發展為時稍晚，理論模式也不斷的在發展當中，所採用的計算公式複雜深奧、艱澀難懂，為一立論與假設均合理與嚴謹的學說，所適用的測驗資料種類雖屬有限，但深受測驗學者的青睞，已有逐漸凌駕古典測驗理論之上，甚至進而取而代之之勢。　　當代測驗理論是為改進古典測驗理論的缺失而來，它具有下列幾項特點，這些特點正是古典測驗理論所無法具備的(Hambleton, 1989; Hambleton & Cook, 1977; Hambleton & Swaminathan, 1985; Hambleton, Swaminathan, & Rogers, 1991; Lord, 1980)：當代測驗理論所採用的試題參數(item parameters)（如：難度、鑑別度、猜測度等），是一種不受樣本影響(sample-free)的指標；也就是說，這些參數的獲得，不會因為所選出接受測驗的受試者樣本的不同而不同。當代測驗理論能夠針對每位受試者，提供個別差異的測量誤差指標，而非單一相同的測量標準誤，因此能夠精確推估受試者的能力估計值。當代測驗理論可經由適用的同質性試題組成的分測驗，測量估計出受試者個人的能力，不受測驗的影響(test-free)，並且對於不同受試者間的分數，亦可進行有意義的比較。當代測驗理論提出以試題訊息量(item information)及試卷訊息量(test information)的概念，來作為評定某個試題或整份試卷的測量準確性，倒有取代古典測驗理論的「信度」，作為評定試卷內部一致性指標之勢。當代測驗理論同時考慮受試者的反應組型與試題參數等特性，因此在估計個人能力時，除了能夠提供一個較精確的估計值外，對於原始得分相同的受試者，也往往給予不同的能力估計值。當代測驗理論所採用的適合度考驗值(statistic of goodness-of-fit)，可以提供考驗模式與資料間之適合度、受試者的反應是否為非尋常(unusual)等參考指標。--------------------------------------------------------------------------------因此，量表评价除了从基于古典的测量理论（信度、效度和反应度）进行评价外，还需对条目进行基于Rａｓｃｈ模型的　IRT（ITEM RESPONSE THEORY）分析，计算条目与模型的拟合度，从条目水平进行评估，可以使用RUMM2020软件进行统计参考资料：
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
谢谢版主，我去看看大家推荐的那几本书，多学习一下
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
很有用呢，最近正在为这个问题烦恼！
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
楼主，你好~请问采用他人硕士论文自编的量表还需要做详细的信效度评定吗？样本例数如何确定，谢谢~
微信扫一扫
广告宣传推广
政治敏感、违法虚假信息
恶意灌水、重复发帖
违规侵权、站友争执
附件异常、链接失效
关于丁香园如何用amos做验证性因子分析
如何用amos做验证性因子分析
09-09-16 &匿名提问
验证性因素分析验证性因素分析是20世纪60年代后从探索性因素分析发展而来的[12]。它可以通过协方差结构模型(Covariance Structure Modeling,CSM)或称结构方程模型(Structure Equation Modeling,SEM)实现。对于数据的计算和模型的验证，现已编有多种计算机软件，其中著名的一种是K.G.Joreskog和D.Sorbom编制的LISREL。在验证性因素分析方法出现之前，对评价中心的构想效度的验证，更多的是用多质多法。对于多质多法的批评意见，主要是认为这种方法以包含测量误差的可观测变量间的相关为基础，来对潜在的结构进行解释，而实际上测量误差每次是不一致的，从而会影响到相关系数，进而影响对潜在结构解释的准确性。验证性因素分析方法则可以解决这个问题，它对误差和相关的变量进行控制，进而得出一个更加令人满意的结果。因而，它很快被公认为一种适宜且通用的评估MTMM数据的方法[12]。在这种方法中，同一特质不同测评方法所决定的因素代表测评的构想效度，而同一测评方法不同测评特质所代表的因素则表明了测评方法的效应。每一个可观测变量均由特质因素、方法因素和测量误差三部分组成。其最大优点在于能对因素的负荷进行固定，并对提出的不同假设模型进行检验。每一种自由负荷的大小反映了问题的所在。如果在能力因素上的自由负荷小且不显著，而在方法因素上的自由负荷大且显著，那么，这种结果就是支持测评方法导向的。反过来，不同测评方法中的同一种能力的因素负荷的值大而且是显著的，那么，就可以认为不同测评方法之间能力的一致性可以得到确认。通过检测这些不同的假设模型，就可以得出评价中心的评分到底是指向测评维度的还是测评方法的。验证性因素分析及其在心理与教育研究中的应用在心理与教育研究中，方法的突破往往是研究取得新进展的一个重要方面。正如班特勒(Bentler，1990)指出：“研究的突破往往在研究方法的变革上。”而心理与教育研究非常复杂，它具有多层面、多指标的特性，常涉及许多变量(包括控制变量、依变量等)，如何对多变量的问题进行研究，一直是人们努力的方向，也取得不少突破性的进展。如兴起于六、七十年代，目前已在社会科学领域里得到广泛的应用，并被称为近年来统计学三大进展之一的协方差结构模型方法(covarian structure models，CSM)。① 通常协方差结构模型分析由两部分组成，一部分是在心理与教育测量中经常使用的验证性因子模型(验证性因素分析)，也可称之为测量模型；另一部分是在经济计量学中使用的结构方程模型。②③顾海根先生已在《上海教育科研》详细介绍了结构方程模型及其在研究中的应用，因而本文拟对验证性因子分析方法及其在心理与教育研究中的应用作一定的说明。一、探索性因素分析与验证性因素分析最早提出因素分析想法的是高尔顿，他奠定了因素分析的基础。其后，斯皮尔曼在研究“一般智力”(general intelligence)中首次采用了因素分析的数学模型方法，使得因素分析的方法得以真正成为现实。我们知道，因素分析是将多个实测变量转换为少数几个综合指标(或称潜变量)，④它反映了一种降维的思想。我们在研究中往往需要对反映事物的多个变量进行观测，收集数据，变量庞大无疑为科学研究提供了丰富的信息，但在一定程度上增加了问题分析的复杂性，由于各变量存在一定相关关系，因而可以通过降维将相关性高的变量聚在一起，因素分析的思想由此而来。最初在因素分析时常采用探索性因素分析方法，如SPSS软件包中的因素分析(Factor analysis)，MINITAB软件包中的因素分析，SYSTAT软件包中的因素分析。随着近年来EQS、LISREL、CALIS等软件的开发，使得验证性因素分析成为可能。下面对两种方法分别予以介绍。 (一)探索性因素分析探索性因素分析详细描述了公共因素的数量和观察变量的分析情况，但没有详细说明这些变量间关系的结构。同时必须有前提假设： 1.所有的公共因素都相关(或都不相关)。 2.所有的公共因素都直接影响所有的观察变量。 3.唯一性因素间无相关。 4.所有的观察变量只有一种唯一性因素影响。 5.所有的公共因素和所有唯一性因素无相关。但在实际中这些前提条件是很难满足的，由于这些假设是先定的，因而研究者无法修正或改进某个模型参数，只能听任计算机自行处理，研究者的主动性也难以体现。这样的模型也常称之为GIGO模型(garbage in/Garbage out，垃圾进，垃圾出)。 (二)验证性因素分析验证性因素分析克服了探索性因素分析的约束，研究者可根据理论或实践研究需要对条件及参数加以控制，如： 1.哪些公共因素是相关的。 2.哪个观察变量受哪个公共因素影响。 3.哪个观察变量受哪个唯一性因素影响。 4.哪些唯一性因素是相关的。 [{1}] 图1表明，研究者假定公共因素E2与E3无相关，而观察变量X4既受公共因素E1的影响，又受公共因素E2影响，且误差S6与S7相关(而这在探索性因素分析中是不能如此假定的)。这说明在验证性因素分析中研究者更主动，更能根据自己的理论提出模型。二、在探索性因素分析基础上采用验证性因素分析近二十年来研究者逐渐采用验证性因素分析方法，现已成为心理和测量的最有力的统计分析方法。美国计算机信息库1995年初提供的资料表明，自70年代至1994年底，美国等其它主要英语国家在154种有关期刊上共发表461篇报告，其中176篇是报告CFA在心理与教育测量中的应用。 80年代末，安德森(Anderson)建议，在理论建立与发展过程中，通过探索性分析建立模型，再用验让性分析来检验模型。例如，在一个样本中先用探索性因素分析找出变量可能的因素结构，再在另一个样本中采用验证性因素分析去验证，这种程序称为交叉证实(Cross-validation)，这样可以保证量表所测特质的确定性、稳定性和可靠性。交叉证实方法的前提是研究人员对因素结构，观测变量与因素之间潜在关系均是未知的或不很清楚，因而先用探索性方法，得到计算机可能的因素结构结果后，再用第二个样本进行验证。但当研究者根据理论及经验已有一定的因素结构维度及观测变量的关系时，则可以直接运用验证性因素方法。三、验证性因素分析的拟合优度在对一个CFA模型作取舍时除了理论上可解释程度之外，还有一个重要指标，即拟合优度，它是指根据数据得出的模型的参数值与理论模型的参数值之间的吻合程度。在验证性因素分析中，对于一个模型，存在模型的真正总体协方差、估计总体协方差、样本协方差和估计协方差。因而，对于一个特定模型来说，存在四类差异——整体差异、近似差异、估计差异和样本差异。整体差异是指模型的真正总体协方差与模型的估计总体协方差之间的差异；近似差异是指模型的真正总体协方差和模型的总体协方差之间的差异；估计差异是指模型的总体协方差和模型的估计协方差之间的差异；样本差异是指模型的样本协方差和模型的估计协方差之间的差异。而拟合度是检验模型估计协方差矩阵和样本协方差的相似程度的指标。 X2/df是直接检验样本协方差矩阵和估计的协方差矩阵间的相似程度的统计量。X2/df的理论期望值为1，X2/df越接近1，说明样本协方差矩阵和估计的协方差矩阵的相似程度越大，模型的拟合度越好。在实际研究中，当X2/df＜5时，可以认为模型的拟合度比较好。但是，X2对样本容量大小非常敏感，因而研究者试图找到一些不随样本容量的大小而变化或者变化小的拟合度指标。如，朱里斯考克等人(Joreskog，Sorbom，1989)提出的GFI和AGFI(调整拟合优度)。⑤还有研究者提出把假设的理论模型和虚无模型相比较，如班特勒(1990)提出的竞争参数(CFI)，玻纳特等人(Bonett，1980)提出的NNFI，波龙(Bollen，1989)提出IFI(差别指数)，都属于这种拟合度指标。⑥⑦下面我们举一则研究实例。⑧ 为了解儿童责任心的维度构成，研究者首先采用探索性因素分析，结果如表1： [{2}] 结果表明，6个因素的特征值接近于1(通常取特征值在0.90以上)。因而初步假定儿童责任心由6个因素构成。在探索性因素分析基础上，研究者再用另一样本进行验证性因素分析，结果如表2：表2中，六因素模型的各种拟合度指数的值都要优于四、五因素模型的拟合度指数。验证性因子分析的结果表明了六因素模型是最适宜的备选模型。由此，我们可以看出验证性因素分析在心理与教育研究中的应用价值，在心理与教育研究中我们不仅可以运用初步的探索性因素分析方法，而且还可以采用更为深入的验证性因素分析方法。在探索性因素分析基础上再采用验证性因素分析方法进行研究已成为国外教育研究的一个新的趋势与热点。注释： ①协方差结构模型的名称很多，也称作协方差结构分析(the analysis of covariance structures)，结构方程模型分析(structure equation model)，矩阵结构模型(the moments structure models)及线性结构关系模型(the linear structural relation model)。通常协方差模型也称为LISREL模型，LISREL也是一种软件，由Joreskog和Sorbon开发。 ②J.Scottlong:Covariance structure models——An introduction to lSREL.Sage publications，Inc. ③Anderson J.C.，Gerbin D.W.(1998).Structrual equation modeling in practice:A review and recommended two-step approach.Psychological Bulletin，103:411-423. ④潜变量指难以或无法实际测得的变量。 ⑤Joreskog Karl G.and Sorbon Dag(1989).LISREL7 User's Reference Guide.Scientific Software. ⑥Bentler，P.M.(1990).Comparative fit indexes in structural models.Psychological Bulletin，107 ⑦Bollen，K.A.(1990).Structural equations with latent variabels.NY:John Wiley&Sons. ⑧作者：姜勇、陈琴《中班幼儿责任心影响因素的协方差结构模型分析》，《心理发展与教育》，1997年2期。希望对你有所帮助，祝你成功！
请登录后再发表评论!

在进行效度影响因素分析时两种因素抽取的方法都需要吗

我要回帖

更多关于什么是效度影响因素的文章

随机推荐

在进行效度影响因素分析时两种因素抽取的方法都需要吗

我要回帖

更多关于 什么是效度影响因素 的文章

随机推荐

更多关于什么是效度影响因素的文章