def中的参数features,label不理解
来源:6-2 训练集、验证集、测试集

迷途20191129
2019-12-29
途索老师:
在6-2中,参数features,label,我理解不过来 ,其中features.values和label.values具体是值什么呢,这个features是不是python中专门指代某些数据的名词,还是您人为设定的呢。另外X_tt,Y_tt这两个变量是什么意思呢?我是新手,烦请老师不吝赐教,有劳了。
def hr_modeling(features,label):
from sklearn.model_selection import train_test_split
f_v=features.values
l_v=label.values
X_tt,X_validation,Y_tt,Y_validation=train_test_split(f_v,l_v,test_size=0.2)
X_train,X_test,Y_train,Y_test=train_test_split(X_tt,Y_tt,test_size=0.25)
print(len(X_train),len(X_validation),len(X_test))
写回答
1回答
-
途索
2019-12-30
同学你好,feature是特征,特征就是做判断,做预测的属性预计,label就是判断和预测的结果。比如,你想通过一个人的穿着,身高,收入,判断一个人的职业,穿着,身高,收入就是feature,这个人的职业就是label。我们需要经验去做判断,这些经验就是过去发生的事件,就是历史数据,我们把它叫做训练集,就是training;另外需要一些没有用来训练的数据做比较,就是测试集,叫做test。思考很有价值,有不明白的及时提问哈。
10
相似问题