Transformer模型怎么保存
来源:10-29 模型训练
qq_慕粉0086819
2019-11-21
我看见git上pending issues 上有这个问题 但是transorformer代码上没有看到模型保存 能尽快更新吗?
写回答
2回答
-
正十七
2019-12-01
已更新到代码库中。
目前来看,对于子类继承的模型,tensorflow2.0中不支持h5格式的保存,对于Sequential的模型才可以保存。而我们的transformer模型,并不是层级结构。因而目前不支持h5格式。
而对于encoder.save(‘encoder’,save_format=‘Tf’)的失败,则是因为我们的模型输入比较复杂,call函数的参数除了input还有mask信息。要想save_format = TF成功,只能有input信息,所以并不符合我们模型的需求。所以也无法实现。
目前可行的方法是checkpoint,即只存储模型的参数。这点我们已经在代码中实现了。可以参考最新的代码。
00 -
正十七
2019-11-24
能,多给我几天时间哈。下周中间左右会更新。
052019-12-23
相似问题