老师,您好!
来源:1-2 课程导学

何永灿
2018-04-02
我刚学了python基础和数据科学基础(numpy、pandas、matplotlib),想开始学这门课程,需要先学其它方面的知识做铺垫吗?
PS:我是制造业转行过来的,想从事数据挖掘方向的工作,没有计算机专业的知识背景。
1回答
-
嗨,同学你好:
数据科学其实算是比较算法和策略的东西,如果没有计算机专业知识背景,或许学习起来会有些吃力,因为有些东西,虽然在学习这门课时我们没有接触到,但如果你掌握了这些技能,学习这门课会有更大的提升。下面,我就我个人的经历,分享一些我觉得数据工作者应该学习的东西和学习这些东西的方法。
一、应该学习的
应该学习的东西应该还是挺多的,可以分成以下三部分:1、数学相关的内容:如概率论,矩阵理论,高等数学等,如果你之前学习过这些内容,现在需要做的,就是复习了;2、计算机算法相关。这部分跟具体的编程语言没有什么关系,主要是关于一些算法基础方面的东西,如数据结构、基本的查找与排序算法、栈、队列、Hash等组织形式等;3、一种编程工具,就是一种编程语言,比如,你选择了Python,也学习了,这就很好。
二、学习的方法
或许,以上这些东西,你之前都学习过或者接触过,但由于长时间没有使用,或者,有可能当时不清楚这个东西有什么用,就没有记住。拿我个人的经历来说,我之前一直不了解联合概率、条件概率有什么用,虽然当时题做得对,但很快,该忘还是会忘。后来,从事数据分析领域后,接触了不少的案例,才知道各种概率原来有这么重要的指导意义,从案例研究了概率后,我发现,我真的记住了,后来,一想到相关的案例,研究这个案例时查阅与学习的知识都全浮现了出来。所以,可能有很多基础知识现在是已经欠缺了,但不要紧,当时学过这些的人,能真正记住的也不多。
基于以上几点,我的学习建议是:可以不从基础直接学,可以直接分析案例与Case,或者直接学习进阶一些的东西。这其中会遇到很多不懂的知识,遇到了什么不懂的,就把那部分仔细再学习一遍。如果学习这部分内容时又遇到了更多不懂的,就再接着学。这个过程是漫长和痛苦的,是需要投入时间和精力,但对于成长和学习来说,这也是必须要走的路。所以,不要想着“快速”学完什么,要讲究让自己尽可能地多装东西。做数据,需要有很多的Case辅助学习与记忆,我推荐Kaggle和Knugget,或者国内的天池,使用这些平台上的Case,学习更多人的思路与经验,会更让你知道这个行业里的人,都是怎么去解决与分析问题的。希望以上这些对你有用。
112018-04-05
相似问题