def中的参数features,label不理解

来源:6-2 训练集、验证集、测试集

迷途20191129

2019-12-29

途索老师:
在6-2中,参数features,label,我理解不过来 ,其中features.values和label.values具体是值什么呢,这个features是不是python中专门指代某些数据的名词,还是您人为设定的呢。另外X_tt,Y_tt这两个变量是什么意思呢?我是新手,烦请老师不吝赐教,有劳了。

def hr_modeling(features,label):
from sklearn.model_selection import train_test_split
f_v=features.values
l_v=label.values
X_tt,X_validation,Y_tt,Y_validation=train_test_split(f_v,l_v,test_size=0.2)
X_train,X_test,Y_train,Y_test=train_test_split(X_tt,Y_tt,test_size=0.25)
print(len(X_train),len(X_validation),len(X_test))
写回答

1回答

途索

2019-12-30

同学你好,feature是特征,特征就是做判断,做预测的属性预计,label就是判断和预测的结果。比如,你想通过一个人的穿着,身高,收入,判断一个人的职业,穿着,身高,收入就是feature,这个人的职业就是label。我们需要经验去做判断,这些经验就是过去发生的事件,就是历史数据,我们把它叫做训练集,就是training;另外需要一些没有用来训练的数据做比较,就是测试集,叫做test。思考很有价值,有不明白的及时提问哈。

1
0

Python3数据分析与挖掘建模实战,快速胜任数据分析师

快速胜任数据分析岗位,逆袭成为数据掘金时代的抢手人才!

2204 学习 · 489 问题

查看课程