Copyright ©2015- 海马课堂网络科技(大连)有限公司 办公地址:辽宁省大连市高新技术产业园区火炬路32A号创业大厦A座18层1801室
添加微信
咨询辅导
很少有人会记得相关性分析是学校统计课上的一个主题,但大多数洞察专业人士都知道它是数据分析的主要内容。这篇文章为大家带来芝加哥大学统计学相关分析课程学习技巧。
一、相关分析的定义
相关分析是一种统计方法,用于发现两个变量/数据集之间是否存在关系,以及这种关系的强度如何。
就市场研究而言,这意味着相关分析用于分析从调查和民意测验等研究方法中收集的定量数据,以确定两者之间是否存在任何重要联系、模式或趋势。
从本质上讲,相关性分析用于发现数据集中的模式。正相关结果意味着两个变量的相关性都在增强,而负相关性则意味着一个变量减少,另一个变量就会增加。
二、相关系数
通常有三种不同的统计相关性排序方法,分别是斯皮尔曼(Spearman)、肯德尔(Kendall)和皮尔森(Pearson)。每种系数都会以 "r "表示最终结果。斯皮尔曼等级和皮尔逊系数是最广泛使用的两种分析公式,具体取决于研究人员所掌握的数据类型:
三、斯皮尔曼等级相关系数
该系数用于检验两个数据集之间是否存在显著关系,其假设条件是所使用的数据是序数,这意味着数字并不表示数量,而是表示受试者所处的位置(如第 1、第 2、第 3 等)。
该系数需要一个数据表,其中显示原始数据、数据的等级以及两个等级之间的差异。两个等级之间的平方差将显示在散点图上,该图将清楚地显示两个变量之间是正相关、负相关还是完全不相关。该系数的限制条件是-1≤r≤+1,如果结果为 0,则表示数据之间没有任何关系。
四、皮尔逊积幂系数
这是最广泛使用的相关分析公式,它衡量的是两个变量的原始数据之间 "线性 "关系的强度,而不是它们的等级。这是一个无量纲系数,这意味着使用该公式进行分析时无需考虑与数据相关的界限,这也是该系数成为研究人员首先尝试的公式的原因。
但是,如果数据之间的关系不是线性的,那么这个特定的系数就不能准确地表示两个变 量之间的关系,这时就必须改用斯皮尔曼等级系数。皮尔逊系数要求必须将相关数据输入一个与斯皮尔曼等级类似的表格,但不带等级,得出的结果将是所有相关系数(包括斯皮尔曼等级和皮尔逊系数)都会得出的数字形式:-1 ≤ r ≤+1。
五、何时使用
上述两种方法应根据所收集的数据是否有相关参数来使用。需要注意的两个术语是
参数法:(皮尔逊系数)必须根据种群或概率分布的参数来处理数据。通常用于已设定参数的定量数据。
非参数:(斯皮尔曼等级)无法对概率分布做出假设。通常用于定性数据,但如果斯皮尔曼秩证明不够充分,也可用于定量数据。
在两者都适用的情况下,统计学家建议使用参数方法,如皮尔逊系数,因为它们往往更精确。但这并不意味着如果没有足够的数据或需要更精确的结果,就不使用非参数方法。
海马课堂专业课程辅导,2100+严选硕博学霸师资,针对学生的薄弱科目和学校教学进度,匹配背景相符的导师,根据学生情况进行1V1专属备课,上课时间灵活安排,中英双语详细讲解课程中的考点、 难点问题,并提供多方位的课后辅导,辅助学生掌握全部课程知识,补足短板。
阅读原文:https://www.highmarktutor.com/news/14654_60.html
版权作品,未经海马课堂 highmarktutor.com 书面授权,严禁转载,违者将被追究法律责任。