关于数据特征提取
来源:8-10 L1, L2和弹性网络
寅时猛抽风
2018-08-25
老师你这个视频里都是以多项式为例,用lasso可以筛选出特征。根据lasso的原理和多项式回归本身就是线性回归,所以我可以立即推,在线性回归中也可以用lasso进行特征提取。 而前一章的pca降维的方法也可以压缩特征,起到一定的特征提取的作用。那么我的问题是,关于特征提取是不是一个很大的课题,有很多种方法可以实现特征提取,能否提供点学习资料,要讲得比较通俗的那种。
波波老师一个2小时的视频,我都需要最少花费4个小时哪能刷完,还只是入门课程,并且需要更加深刻的理解,还需要线性代数和概率与统计的充分理解,高数貌似现在为止就是用了个复合函数求导。机器学习之所以现在这么缺人,一方面是因为计算机算力发展近十几年才能达到要求,另一方面,确实还是这个涉及面太广了,单纯的一个数学都够呛,还要编程,还要专业知识。
2回答
-
对,特征工程是一个很大的话题。而且深入机器学习,会发现特征工程是一个很重要的话题。可以在网上搜索“特征工程”寻找相关资料。书籍方面,比如在亚马逊上就有这些相关书籍:https://www.amazon.com/s?url=search-alias%3Daps&field-keywords=feature+engineering&sprefix=feature+engineer%2Caps%2C207&crid=22UPG9M8XLIMK
同时,特征工程更复杂的地方在于,高度领域相关,处理的领域不同,数据不同,有效的特征工程的方式很有可能完全不同。具体在不同领域的优秀的特征工程方法,需要参考更多领域论文,或者专有领域的相关材料。从某个角度,甚至可以说,每个领域的前沿研究中,有大量研究,就是在搞这个领域的特征工程:)
对于特征工程这种内容,当下的情况是,有系统介绍的材料就已经很好了,通俗易懂简直是奢求。通过上面我给你的亚马逊的链接可以看出来,连“特征工程”相关的书籍都少之又少:)
关于特征工程的更多讨论,可以参考这个问答:https://coding.imooc.com/learn/questiondetail/40722.html
加油!
012018-08-25 -
寅时猛抽风
提问者
2018-08-25
现在是凌晨三点多,我都怀疑你是否身在中国。
打开您提供的链接,居然全部是英文书籍,怎奈我四级都没过。看来还是要继续学习英语,今年刚考上的研究生,英语只考了36分,实在是惭愧
022018-08-25
相似问题