有两个代码的具体问题,请老师帮忙解答,谢谢

来源:6-10 数据处理-训练语料问答对的处理(2)

protess

2019-03-31

问题1:在fake_data.py文件里面,generate最后return的是4个对象,其中后两个ws_input, ws_target是WordSequence()这个类的实例对象,请问针对实例,我们打印出来的len(ws_input) == 14和 len(ws_target)==9是代表什么意义了?我理解实例化对象是不应该有长度的啊,如果len有意义,这个14和9代表的长度具体是什么了?

问题2:在data_utils.py文件里:
(1)能简要说明一下batch flow函数中,raw的意义吗?您的注释中“raw:是否返回原始对象,如果为True,假设结果ret, 那么len(ret) == len(data) * 3,如果为false,那么len(ret) == len(data) * 2”看不懂,为什么要乘以2或者3了?
(2)能简要说明一下batch_flow_bucket函数中,bucket的意义吗?注释中“ #bucket_ind 是指哪一个维度的输入作为bucket的依据
#n_bucket就是指把数据分成了多少个bucket”看不懂,我分bucket的意义在哪里了?

谢谢老师!

写回答

1回答

Mr_Ricky

2019-04-29

1、一个是代表输入的长度,一个是代表标签的长度

2、是否乘以2或者3是根据是否使用残差来做的,最前面有定义;

3、bucket实际上就是为了知道要分成多少分,方便最后的训练。

0
0

NLP实践TensorFlow打造聊天机器人

解析自然语言处理( NLP )常用技术,从0搭建聊天机器人应用并部署上线,可用于毕设。

673 学习 · 281 问题

查看课程