你对这个回答的评价是
|
版权声明:本文为博主原创文章未经博主允许不得转载。 /u/article/details/
(3)相关系数和协方差
具体的实现以上各个数据项
若干用户贡献包都提供了计算描述性统计量的函数其中包括Hmisc、pastecs psych。
使用其他用户提供的包进行统计分析的功能
Hmisc包中的describe()函数可返回变量和观测的数量、缺失值和唯一值的数目、平均值、
分位数以及伍个最大的值和五个最小的值
有缺点就是,每次只能使用一个统计函数
doBy包和psych包也提供了分组计算描述性统计量的函数
其中的formula接受以下的格式:
在~左侧的变量是需要分析的数值型变量而右侧的变量是类别型的分组变量。function
可为任何内建或用户自编的R函数
使用gmodels包中的CrossTable()函数是创建二维列联表的第三种方法
(1)对于标称属性的X方检验(主要针对于列联表)
治疗的效果跟性别没有关系,跟治疗的方案有关系
可以P-value值得概率来判断是否推翻假设
p<0.01 二个变量的独立假设是不成立的
(2)Fisher精确检验(一般用于多维的检验)
其原假设是两个名义变量在第三个变量嘚每一层中都是条件独立的
(4)二维列联表的相关性度量
vcd包中的assocstats()函数可以用来计算二维列联表的phi系数、列联系数和Cramer’s V系数
Pearson积差相关系数衡量了两个定量变量之间的线性相关程度。Spearman等级相关系数则衡量分级定序变量之间的相关程度Kendall’s Tau相关系数也是一种非参数的等级相关度量。
cor()函数可以计算这三种相关系数而cov()函数可用来计算协方差
polycor包中的hetcor()函数可以计算一种混合的相关矩阵,其中包括数值型变量Pearson积差相关系数、数值型变量和有序变量之间的多系列相关系数、有序变量之间的多分格相关系数以及二分变量之间的四分相关系数
如何验证一个数据框Φ各个属性是否相关
一次验证多个属性是否相关(正相关,负相关不相关)
y是数值向量,x是二元变量
(2)非独立样本的t检验
七、若两组數据独立,可以使用Wilcoxon秩和检验(更广为人知的名字是Mann–Whitney U检验)来评估观测是否是从相同的概率分布中抽得
请先安装npmc包。此包中的npmc()函数接受的输入为一个两
列的数据框其中一列名为var(因变量),另一列名为class(分组变量)
你对这个回答的评价是
|