文本数据分类

来源:7-13 章节总结

慕云19

2019-09-18

http://img1.sycdn.imooc.com/szimg/5d8232fe09e5fa4214060779.jpg

老师,我自己的数据集,生成(N,100)的向量,为什么会吹这个错

X_train,X_test,y_train,y_test=train_test_split(X,y,test_ratio=0.3)
print(X_train)
print(X_train.shape)
print(y_train)
print(y_train.shape)

y_train = utils.to_categorical(y_train)
y_test = utils.to_categorical(y_test)


model = keras.models.Sequential()

model.add(keras.layers.Embedding(input_dim=100,
                                 output_dim=100,trainable = False))
model.add(keras.layers.LSTM(1024, dropout = 0.5, recurrent_dropout = 0.5))
model.add(keras.layers.Dense(1024,activation='relu'))
model.add(keras.layers.Dense(578,activation='softmax'))

model.summary()

sgd = keras.optimizers.SGD(lr=0.0001)
model.compile(loss='binary_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

history = model.fit(X_train,y_train,
                    epochs=10,
                    validation_data=(X_test,y_test),
                    batch_size=64)


写回答

1回答

正十七

2019-10-01

看错误是因为你的数据里有-1的存在啊。是不是UNK都被处理成了-1?

如果是的话,需要给UNK也加一个正的id值,并且也要有embedding才行。

0
0

Google老师亲授 TensorFlow2.0 入门到进阶

Tensorflow2.0实战—以实战促理论的方式学习深度学习

1849 学习 · 896 问题

查看课程