老师，model.pkl modelA.pkl modelB.pkl分别是训练多少轮得到的呢，效果这三个比较起来怎么样

首页课程实战体系课手记专栏慕课教程

老师，model.pkl modelA.pkl modelB.pkl分别是训练多少轮得到的呢，效果这三个比较起来怎么样

来源：8-27 demo脚本编写及演示

慕雪2383569

2020-03-13

写回答

2回答

胖虎

2020-07-22

轮数都是一样的，参数默认的，只是选用不同的attetion，比如L-attention，B-attention，网络结构有区别，是3层，5层

0

0

胖虎

2020-03-13

三个都是模型，轮数差不多的，是不同的attention机制的组合

0

0

基于Pytorch热门深度学习框架从零开发NLP聊天机器人

基于中科院所内项目，Seq2Seq+attention主流算法，实战聊天机器人

273 学习 · 107 问题

相似问题

最后loss收敛到多少

回答 1

bleu和ambave的值是多少

回答 3

在运行demo.py 时遇到这个问题该怎么办

回答 3

胖虎老师，我该怎么操作才能自己训练模型啊，按照课程8-25的的训练代码发现并不能成功

回答 1

老师，面试官问做这个项目主要遇到什么技术难题，是如何解决的？

回答 2

打开慕课网App查看更多内容