对于直方图的理解
来源:3-5 编码实现(基于python2.7)

迷途20191129
2020-12-26
老师您好:
对于直方图背后反映出的业务逻辑我想请教如下:
1、如果特征的直方图出现偏态,那么意味着什么呢?是否意味着数据质量不理想呢?
2、全量数据的特征分布出现偏态,是否意味着业务的规则出现了问题呢?
3、我们可以从特征的分布规律中解读出哪些有用的内容指导生产呢?
写回答
1回答
-
同学你好,
1、如果数据发生偏态不一定就意味着数据质量不好,背后的业务含义比较复杂,需要看当时的情境做出判断。我们看直方图有时的目的就是为了了解数据的基本形态,有偏态有时正是数据此时的形态。
2、同上。判断业务是否出了问题应该先找到一个参照系,比如上个月的业务指标,来比较当期指标和上期指标有什么不一样,来判断业务指标是否出现异常,而不应该仅通过偏态来进行判断。
3、A、可以及时找到异常值,找到极为异常的情形;B、分布本身不意味着什么,但如果结合时间,分布的变化就有很丰富的意义了。比如,我国第一产业第二产业第三产业的分布变化,就可以反映出我国的发展方向;C、不同实体同一指标的分布进行比较,也会有特别的意义,比如,我国的一二三产的分布和美国的一二三产的分布进行比较,就可以定位两个国家的不同产业发展特点。00
相似问题
自因变量优化工程实现的方法
回答 1
代码理解
回答 2