关于数据清洗的问题
来源:7-8 文本生成实战之采样生成文本
迷途20191129
2020-12-09
老师您好:
请问使用深度学习框架的话,对于数据的格式来说,除了需要做归一化之外还需要做哪些方面的数据预处理工作吗?
例如,如果一张表里面有“ID”这个字段,我需要删除这类无用字段吗?对于存在缺失值的数据集需要做缺失值处理吗?
谢谢老师。
写回答
1回答
-
正十七
2021-01-07
需要,数据清洗工作还是必不可少的,不过深度学习不需要那么多的特征工程上的工作,因为深度学习模型本身具有很强的抽象能力。
对于缺失值,需要具体问题具体分析,有些有逻辑上比较明确的默认值,有些则是用现有数据的均值等。
00
相似问题