零和假设,相关系数

来源:4-7 编码实现

阳soleil

2022-08-13

老师你好,我想问我们习惯把小概率发生事件当作原假设还是被择假设?

还有我想研究公司人员迟到天数和居住公司距离,家庭状况,孩子个数,年纪之间的关系,数据量3000多条。相关系数表明迟到天数和所有变量之间都没有相关关系。那么,我可以直接得出员工迟到天数和这些变量之间都没有关系的结论吗?还有,所有单一自变量都与因变量(迟到天数)没有相关关系,我是否有必要组合这些自变量,继续探讨复合因子与因变量的关系?如果没有找出关联,是否有以下几种可能:算法不对,数据量不够大,确实不相关?
谢谢老师

写回答

1回答

途索

2022-10-21

同学你好,
问题1:原假设是我们假定的假设检验量成立的假设,和概率大小是没有直接关系的。
问题2:3000多条数据其实已经足够多了,如果相关系数不能说明相关,那我们可以认为不相关。组合多自变量,进行非线性相关的运算在数学上是可行的,但理解上似乎没有什么太大意义。最后,你提的几种可能,都是可能的情况,相关性的算法可以多试几种(如Spearman、互信息等)看看。
0
0

Python3数据分析与挖掘建模实战,快速胜任数据分析师

快速胜任数据分析岗位,逆袭成为数据掘金时代的抢手人才!

2204 学习 · 489 问题

查看课程