关于数据清洗的问题

来源:7-8 文本生成实战之采样生成文本

迷途20191129

2020-12-09

老师您好:
请问使用深度学习框架的话,对于数据的格式来说,除了需要做归一化之外还需要做哪些方面的数据预处理工作吗?
例如,如果一张表里面有“ID”这个字段,我需要删除这类无用字段吗?对于存在缺失值的数据集需要做缺失值处理吗?
谢谢老师。

写回答

1回答

正十七

2021-01-07

需要,数据清洗工作还是必不可少的,不过深度学习不需要那么多的特征工程上的工作,因为深度学习模型本身具有很强的抽象能力。

对于缺失值,需要具体问题具体分析,有些有逻辑上比较明确的默认值,有些则是用现有数据的均值等。

0
0

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程