有两个代码的具体问题,请老师帮忙解答,谢谢
来源:6-10 数据处理-训练语料问答对的处理(2)

protess
2019-03-31
问题1:在fake_data.py文件里面,generate最后return的是4个对象,其中后两个ws_input, ws_target是WordSequence()这个类的实例对象,请问针对实例,我们打印出来的len(ws_input) == 14和 len(ws_target)==9是代表什么意义了?我理解实例化对象是不应该有长度的啊,如果len有意义,这个14和9代表的长度具体是什么了?
问题2:在data_utils.py文件里:
(1)能简要说明一下batch flow函数中,raw的意义吗?您的注释中“raw:是否返回原始对象,如果为True,假设结果ret, 那么len(ret) == len(data) * 3,如果为false,那么len(ret) == len(data) * 2”看不懂,为什么要乘以2或者3了?
(2)能简要说明一下batch_flow_bucket函数中,bucket的意义吗?注释中“ #bucket_ind 是指哪一个维度的输入作为bucket的依据
#n_bucket就是指把数据分成了多少个bucket”看不懂,我分bucket的意义在哪里了?
谢谢老师!
写回答
1回答
-
Mr_Ricky
2019-04-29
1、一个是代表输入的长度,一个是代表标签的长度
2、是否乘以2或者3是根据是否使用残差来做的,最前面有定义;
3、bucket实际上就是为了知道要分成多少分,方便最后的训练。
00
相似问题