集团品牌网站建设,asp.net网站开发步骤,nas可以做网站,使用wordpress创建企业官网变量说明#xff1a;
在确定分析方法前#xff0c;我们需要了解手中的数据类型#xff0c;这是最基础也是有必要的#xff0c;在所有的数据类型中#xff0c;我们将数据类型分为分类变量也为定类变量和连续变量也称为定量变量#xff0c;那么什么是定类变量#xff1f;… 变量说明
在确定分析方法前我们需要了解手中的数据类型这是最基础也是有必要的在所有的数据类型中我们将数据类型分为分类变量也为定类变量和连续变量也称为定量变量那么什么是定类变量什么是定量变量
定类变量通俗的讲数字大小不具有比较意义比如性别中1代表男2代表女仅仅代表类别在比如下图中1代表底妆2代表唇妆等等仅是类别关系。 定量变量通俗的讲数字大小具有比较意义比如调查青少年身高1.4m比1.3m高数字本身具有比较意义在比如如下图片沙发的价格数字越大说明越贵数字越小说明越便宜数字之间是可以比较的。通过数据类型的说明本次探讨我们以数据类型的不同进行分类说明分别是分类和连续变量、连续和连续变量、分类和分类变量。 一、分类×连续 如果数据的类型是分类变量和连续变量那么他的相关性分析或者差异性分析有哪些方法呢接下来进行说明。
1、分析方法
如果数据是分类变量和连续变量那么进行分析时分析方法大体可以分为三类参数检验、非参数检验以及可视化图形其中参数检验又包括t检验、方差分析非参数检验包括MannWhitney统计量、Kruskal-Wallis统计量。以及还可以使用可视化图形进行查看。 01、参数检验
T检验T检验说明 T检验独立样本t检验一般是研究定类变量和定类变量之间的差异性并且定类变量为二分类变量比如研究性别和薪资之间是否有显著性差异性别包括男和女。T检验数据格式 在进行数据分析之前都需要将数据整理成正确的数据格式然后在进行分析那么t检验严格讲为独立样本t检验的数据格式是什么样的呢如下说明 T检验的数据一般有两列第一列是组别二分类第二列是对应的分析项比如说想要研究不同性别的身高是否有显著性差异其正确的数据格式如下 T检验操作 整理成正确的数据格式之后接下来进行准备利用T检验进行分析分析操作是怎样的呢以SPSSAU举例进行说明 【通用方法t检验】→【拖拽分析项】→点击开始分析 T检验结果一般形式 一般结果中会提供均值标准差以及t统计量和p值等。
方差分析方差分析说明 方差分析单因素方差分析一般是研究定类变量和定类变量之间的差异性并且定类变量为多分类变量比如研究学历和薪资之间是否有显著性差异学历包括本科以下、本科以及本科以上。方差分析数据格式 方差分析严格来讲是单因素方差分析的数据格式如下说明 方差分析的数据一般有两列第一列是组别多分类第二列是对应的分析项比如说上表格中1本科以下、2本科、3本科以上。方差分析操作 【通用方法方差分析】→【拖拽分析项】→点击开始分析 方差分析结果一般形式 一般结果中会提供均值标准差以及F统计量和p值等。
02、非参数检验
MannWhitney统计量MannWhitney说明 MannWhitney非参数检验一般是研究定类变量和定类变量之间的差异性并且定类变量为二分类变量比如研究性别和薪资之间是否有显著性差异性别包括男和女。其数据格式与独立样本t检验类似组别为一列对应的定量变量为一列。MannWhitney操作 【通用方法非参数检验】→【拖拽分析项】→点击开始分析 MannWhitney结果一般形式 一般结果中会提供中位数以及统计量和p值等。
Kruskal-Wallis统计量Kruskal-Wallis说明 Kruskal-Wallis非参数检验一般是研究定类变量和定类变量之间的差异性并且定类变量为多分类变量比如研究学历和薪资之间是否有显著性差异学历包括本科以下、本科以及本科以上。其数据格式与单因素方差类似。操作与MannWhitney一致SPSSAU会自动判断分类变量的分类数进而判断使用MannWhitney还是Kruskal-Wallis其一般形式如下 一般结果中会提供中位数以及统计量和p值等。03、可视化图形
可视化图形
除了可以利用假设检验进行分析外还可以使用图形进行简单判断分析由于数据是定类和定量所以可以使用折线图、条形图、柱形图、雷达图、箱形图、小提琴图、核密度图等。其中折线图、条形图、柱形图、雷达图可以统称为簇状图簇状图和箱形图、小提琴图、核密度图的数据格式定类为一列定量为一列可以在SPSSAU的可视化板块进行选择分析。示例类似如下 2、方法PK
分类变量和连续变量可以进行参数检验、非参数检验以及可视化图形那么这些方法应该如何去选择呢接下来进行说明
01、参数检验PK非参数检验 按假设检验类别进行分类分为参数检验和非参数检验如果数据为二分类变量比如分类变量为性别包括男和女或者为两组分为第一组第二组。一般考虑使用t检验参数检验或者mannwhitney非参数检验如果分类变量是多分类变量比如分类变量是专业包括理学、农学、医学或者分类变量是学历包括专科、本科、硕士、博士。一般考虑使用方差分析参数检验或者Kruskal-Wallis非参数检验那么参数检验和非参数检验有什么区别呢
参数检验和非参数检验的区别参数检验是假定数据服从某分布一般为正态分布通过样本参数的估计量x±s对总体参数进行检验比如t检验、u检验、方差分析等。非参数检验则不需要假定总体分布形式直接对数据的分布进行检验。但是参数检验的效能比非参数检验效能高以及对于t检验和方差分析其在实证研究中具有一定的耐性如果不是严重不满足正态分布都是可以使用t检验或者方差分析进行分析的。
02、可视化图形PK 对于分类数据和连续数据之间的可视化图形从应用角度可以分为三类第一类是主要用于不同数据的对比可以考虑使用柱形图、条形图、雷达图比如不同性别的薪资水平对比。第二类主要用于查看不同组数据的变化趋势一般可以考虑使用折线图比如不同专业的成绩变化。第三类主要用于不同组别数据的分布可以考虑使用箱线图、小提琴图或者核密度图比如南方北方的身高分布。一般在分析时建议可以结合检验和可视化图形进行分析然后得到相应结论。
3、举例分析
比如想要分析如下数据
第一组44、55、67、45、46、56、69、34、59、78、99
第二组49、59、62、56、68、45、77、89、99、102、45
分析不同组别之间的相关性差异性。
分析由于是分析不同组别之间的相关性差异性由于组别是二分类变量所以考虑使用t检验或者非参数检验由于数据基本服从正态分布所以采用t检验和可视化图形进行结合分析。
直方图正态检验的结果如下 从结果中看到直方图呈现类似“倒扣的钟形”所以认为数据基本服从正态分布。
01、分析流程 T检验的分析流程大体可以分为四步
整理成正确的数据格式验证t检验的前提条件前提条件正态分布、进行操作T检验的结果分析
Step1
整理数据格式组别为一列数据为一列所以整理的结果如下 Step2
T检验的前提条件
样本独立正态分布方差齐性
Step3t检验操作 上传数据后点击通用方法的t检验然后将分析项拖拽到对应分析框内点击开始分析。
Step4T检验的结果分析
02、解读分析结果 从t检验分析结果可以看出第一组的均值为59.27、第二组的均值为68.27从均值中可以看出来第二组数据平均水平上大于第一组数据然后t统计量为-1.077p值为0.294大于显著性水平说明模型不显著也即说明第一组数据与第二组数据之间没有差异性。与此同时我们还可以使用柱形图或者条形图进行可视化分析 从可视化图形中可以看出第二组数据均值大于第一组数据但是柱形图中只能看处出两组数据的简单对比对于模型的分析或者显著性的判断还是需要进行假设检验。
03、指标解读
对于t检验中的t值如何计算得到呢 样本1的均值本例子中为59.27样本2的均值本例子中为68.27样本1的方差本例子中为18.34^2336.3556;样本2的方差, 本例子中为20.78^2431.8084;样本1的样本量, 本例子中为11;样本2的样本量, 本例子中为11,
计算t值为-1.077其它指标的计算可以登录SPSSAU官网进行查看。
二、连续×连续 如果数据的类型是连续变量和连续变量那么他的相关性分析或者差异性分析有哪些方法呢接下来进行说明。
1、分析方法
如果数据是连续数据和连续变量那么进行分析时分析方法大体可以分为四类相关分析、参数检验、非参数检验以及可视化图形其中相关分析一般包括皮尔逊pearson相关系数以及斯皮尔曼spearman相关系数。如果连续变量和连续变量的样本量是相同的可以考虑使用参数检验中的配对t检验非参数检验包括配对wilcoxon可视化图形可以考虑使用散点图。
01、相关分析
相关分析说明
相关分析一般是研究定量数据和定量数据的相关性以及变量之间存在相关性相关程度是如何的比如研究身高和体重之间是否有关联等等。
相关分析数据格式
在进行数据分析之前都需要将数据整理成正确的数据格式然后在进行分析那么相关分析的数据格式是什么样的呢如下说明 相关分析的数据格式为一个分析项为一列比如上图中研究身高和体重则身高为一列、体重为一列。
相关分析操作
整理成正确的数据格式之后接下来准备进行相关分析分析操作是怎样的呢以SPSSAU举例进行说明
【通用方法相关分析】→【拖拽分析项】→点击开始分析 相关分析结果一般形式 分析结果一般包括相关系数以及p值和样本量一般分析时查看p值就好了。
相关系数判断标准 不同的文献相关系数的判断标准不同如果在分析中建议以及所参考的文献等进行参考比如上面的文献就来自于贾俊平, 何晓群, 金勇进. 统计学.第7版[M]. 中国人民大学出版社, 2018.
02、参数检验
配对t检验说明
配对t检验一般是研究配对的定量数据和定量数据之间的差异关系比如研究某班级补习前后两次的语文成绩是否有差异。
配对t检验的数据格式
配对t检验的数据格式比较特殊因为不仅需要为定量变量还需要数据为配对数据也就是两组数据的样本量是需要相同的一般如下 配对t检验操作
【通用方法配对t检验】→【拖拽分析项】→点击开始分析 配对t检验的一般形式 分析结果一般包括配对的均值和标准差、统计量t值以及p值。
03、非参数检验
配对wilcoxon配对wilcoxon说明 配对wilcoxon一般是研究配对的定量数据和定量数据之间的差异关系比如研究某班级补习前后两次的语文成绩是否有差异。配对wilcoxon的数据格式 其数据格式与配对t检验一致。配对wilcoxon操作 【实验/医学研究配对样本wilcoxon】→【拖拽分析项】→点击开始分析 配对wilcoxon的一般形式 分析结果一般包括配对的中位数、统计量z值以及p值。04、可视化图形
散点图
散点图说明
散点图一般用于绘制定量数据和定量数据关系研究时比如想要观察身高和体重的关系就可以使用散点图进行研究。
散点图的数据格式
散点图的数据格式与相关分析一致。
散点图操作
【可视化散点图】→【拖拽分析项】→点击开始分析 散点图的一般形式 2、方法PK
连续变量和连续变量可以进行相关分析、参数检验、非参数检验以及可视化图形那么这些方法应该如何去选择呢接下来进行说明
01、相关系数PK Pearson相关系数也叫皮尔逊积矩相关系数通常用r表示使用pearson相关系数数据需要满足
线性正态分布没有异常值
如果不满足条件可以考虑使用spearman相关系数以及pearson相关系数的计算如下 Speaman计算公式如下 针对pearson相关系数不能识别非线性关系以及并且对一个或者几个异常值比较敏感此时可以使用spearman相关系数进行替代spearman相关系数有时也被称为级别相关系数或者秩相关系数该相关系数是根据两个变量的秩进行相关分析spearman相关系可以用来衡量两个变量之间是否存在单调相关关系。当值为1时说明一个变量随着一个变量单调递增当值为-1时说明一个变量随着另一个变量单调递减。
02、参数检验PK非参数检验 按假设检验类别进行分类分为参数检验和非参数检验如果服从正态分布可以使用配对t检验如果不满足正态分布可以使用配对wilcoxon检验对于参数检验和非参数检验的区别可以查看上一个模块。对于散点图一般和相关分析一起联用在相关分析前探索数据之间的关系。
3、举例分析
想要了解高中生的母亲受教育年数和学生的科学素养是否有关联测得19名学生的母亲受教育年数和学生的科学素养数据如下。 分析由于是分析不同组别之间的相关性差异性由于组别是二分类变量所以考虑使用t检验或者非参数检验由于数据基本服从正态分布所以采用t检验和可视化图形进行结合分析。
正态检验的结果如下 从结果中可以看到模型不显著接受原假设说明数据服从正态分布。
01、分析流程 此案例的相关分析分析流程大体可以分为五步
整理成正确的数据格式进行散点图查看验证相关分析的前提条件前提条件正态分布、进行操作相关的结果分析
Step1
整理数据格式一个分析项为一列所以整理的结果如下 Step2
pearson相关分析的前提条件
两变量为连续变量两变量存在线性关系两变量呈现正态分布
Step3进行绘制散点图
简单查看下数据的关系。
Step4相关分析操作 上传数据后点击通用方法的相关分析然后将分析项拖拽到对应分析框内点击开始分析。
Step5相关的结果分析
02、解读分析结果
1散点图 从散点图可以看出散点是杂乱无章的从图中看起来学生科学素养与母亲受教育年限大概没有关系可以进一步查看相关分析。 从相关分析的结果中可以看出相关系数为0.08说明二者之间的关系极弱以及p值大于0.1说明整体模型不显著拒绝原假设二者没有相关关系。
03、指标解读
对于pearson相关系数具体如何计算呢 计算过程如下 三、分类×分类 1、分析方法
如果数据是分类变量和分类变量那么进行分析时分析方法大体可以分为三类卡方检验、可视化图形其中卡方检验又包括pearson卡方、fisher卡方、yates校正卡方、cochran-armitage检验、线性趋势卡方以及还可以使用可视化图形堆积柱形图、条形图进行查看。 01、卡方检验
卡方检验
卡方检验说明
卡方检验一般是研究定类数据和定类数据之间的差异性比如研究性别和是否吸烟之间的显著性差异。
卡方检验数据格式
卡方检验的数据格式为一个分析项为一列如果有加权格式则加权格式单独为一列如下说明
1普通格式 2加权格式 卡方检验操作
整理成正确的数据格式之后接下来进行卡方检验分析操作是怎样的呢以SPSSAU举例进行说明
【实验/医学研究卡方检验】→【拖拽分析项】→点击开始分析 卡方检验结果一般形式 一般结果中会提供均值标准差以及卡方值和p值等。
02、可视化图形
为了更清楚的表示各个类别占比可以使用渡记柱形图或者条形图进行表示。 2、方法PK
1不同类卡方检验pk 2其它方法说明
除了可以使用卡方检验外还可以使用可视化图形进行描述分类变量和分类变量之间的关系比如可以使用堆积柱形图和堆积条形图进行描述更加直观分析时可以结合自己的分析方法进行绘制研究。
03、举例分析
1分析流程
想要调查不用性别男、女的饮食习惯米食、面食针对卡方检验的分类应该使用pearson卡方检验。 2解读分析结果 从分析结果中看出男性更偏爱吃面食占比为60女性更偏爱吃米食约占调查中的80。从数据来看不同性别的饮食习惯有差异模型中的卡方值为16.667其中p值小于0.05拒绝原假设说明模型显著不同性别的饮食习惯有差别。并且从堆积柱形图中也可以直观查看到男性更爱吃面食女性更爱吃米食。 3指标解读 其中Ai为i水平的观察频数Ei为i水平的期望频数k为单元格数。
比如 计算如下 参考文献
[1]朱玉祥,江剑民,赵亮,等.不同计算形式的相关分析在气象中的应用综述[J].热带气象学报, 2021, 37(1):1-13.