变量之间的相关性分析流程

来源:4-10 相关分析与实现

iPhiliph

2018-11-13

老师,你好,连续变量和离散变量之间的相关性是分别计算。那么在实际工作中,我们去分析变量之间的流程是怎么样的呢?是分别计算连续变量和离散变量的相关性?然后再分析连续变量和离散变量的相关性?具体流程是怎样的呢?同时连续变量和离散变量之间的相关性是用什么指标呢?

写回答

1回答

途索

2018-11-14

同学你好,在实际的使用场景中,计算哪些因子的相关性,是根据具体的业务需求来的。比如,在本例中,我们想了解公司离职与其它各个因子的相关关系,就需要把离职属性与各个属性都拿出来,分别根据离散或者连续的特性,进行计算。如果你对工资和入司时长间的关系有兴趣,也可以拿这两个出来进行计算。在公司,在一个分析型业务中,计算哪些变量之间的关系,一般由产品经理或者其它需求方提出。当然,你也可以自己把所有属性两两之间根据离散或者连续进行相关对比,一并输出,也是Ok的。

连续变量和离散变量之间的相关性考量,可以有以下几种思路:一是把连续值离散化,或者把离散值连续化,再进行对比;二是根据离散值对数据集进行分群,然后对各个群进行卡方分析、方差分析等假设检验类的分析,得到它们的差异是否显著,如果差异较大,说明离散值与连续值有较大的相关联系。

1
1
iPhiliph
非常感谢!
2018-11-14
共1条回复

Python3数据分析与挖掘建模实战,快速胜任数据分析师

快速胜任数据分析岗位,逆袭成为数据掘金时代的抢手人才!

2204 学习 · 489 问题

查看课程