转化为Unicode编码

来源:7-7 数据预处理之分词

慕云19

2019-05-09

label, content = line.decode('utf-8').strip('\r\n').split('\t')

老师,请问一下,这里为什么需要转化为Unicode编码

写回答

1回答

正十七

2019-05-17

因为是中文数据集,如果不转化的话,那么很多量都不对了,比如长度。

0
1
慕云19
非常感谢!
2019-05-18
共1条回复

深度学习之神经网络(CNN/RNN/GAN)算法原理+实战

深度学习算法工程师必学,深入理解深度学习核心算法CNN RNN GAN

2617 学习 · 935 问题

查看课程