五问小迷妹!Summer学FIT5145你必须知道的事!

2019年12月06日 墨尔本留学生俱乐部


墨尔本留学生俱乐部

半鸡汤半吐槽,还有点闷骚



大家好,这里是大圣教育小迷妹~ 前几天说了很多关于IT求职就业的问题,今天我们回归课程本身,来带领大家小窥一番将于1月份开始的Monash Summer B学期,很多IT Master的宝宝们都会考虑学习的一门课 —— FIT5145 Introduction to data science 数据科学



对于Master of Data Science的小伙伴来说,它是Data Science 学生Part B阶段的必修课,IT 和 BIS Part B阶段的重要选修课程之一,特别是对BIS的学生来说这门课涉及到大量的数据分析应用,既重要又实用。它的前置课程是9133 Python 或 9131 JAVA加上 9132 Database,对于IT学生来说这几门课可都不是善茬,尤其是对于很多没有IT背景的学生来说,其难度可想而知。



今年Summer B阶段的课程除去以小组作业和Report为主的5057 Project Management,就剩下这门看上去颇为硬核的5145。以至于很多学生刚一听闻就果断都投入没有Final的PM怀抱,却不知本就节奏偏快的第三学期却马上要被无尽的小组讨论和essay吞没(七八十页的report,还要催三哥们赶快参加活动,苦不堪言),而5145这门课只要掌握了另辟蹊径的破解之法,靠自己总结和学习小迷妹居然觉得压力会小很多……


这是真的吗?看完这篇文章你就明白啦!


1
问小迷妹一: 课程设置和作业难吗?


Summer的5145保留了全部的知识内容,只是作业设置和有所不同,作业大部分集中在后半段Due,前半段压力较小。但由于Summer节奏很快,其实从第二周第四节课开始平均每周都要至少交一个大作业,还要准备演讲,所以后半段压力还是会有一些。



除考试外,Summer学期一共有四个作业,分别是一个代码作业(1月18日due),一个case study的report分成plan(1月25日due)和report撰写(2月1日due)两个作业,还有一个演讲(2月1日以后陆续安排)。比正常学期少了一个代码作业。被取消的原Assignment3是一个非常复杂的代码设计。究竟有多复杂呢,小迷妹给大家展示一下上学期5145老师呕心沥血准备的一部分辅导材料,大家一看便知。



是不是有种逃过一劫的感觉呢?其实也并不全是好消息,因为该作业的取消其百分之十的占比被分配至最后的大报告和演讲,而且第一个代码作业以Python为主,的占比和难度都要远高于第二个作业,而且题量巨大,后续的画图和report都于此相关。上面第二个作业使用R和Shell写,基本上都是入门的句法,所以你光是逃是肯定逃不掉的。



2
问小迷妹二:这门课的技术层面究竟在学什么?


5145这门课是由文科和理科,或者是由技术或者非技术两面结合的一门课,无论在平时授课还是考核作业的过程中,编程内容跟概念内容兼有。平时的作业的话考核方式主要是以代码为主,期末考试这块属于大量的概念内容,属于我们要记要背,更要理解的内容。


我们先来讲一下理科部分,也就是编程相关的一些东西。也是这门课的绝对难点。之前提到了这门课主要需要掌握三种编程内容,分别是python, Shell和R



Python是比较难的一部分, 专门的编程内容会比较偏向于 object oriented这个概念,也就是面对对象。但5145这门课它的侧重点在于利用python进行数据分析,或者说进行大数据处理。这门课Python主要是掌握对数据的处理和运用,然后还有数据的可视化实现,基本数据结构,最主要的是一块对于Library的应用。


这门课的Library主要涉及三个包: Pandas这个Library里面基本包含了计算的函数,求均值,求方差等等。基本上你以前可能用Excel实现的东西都会可以用Pandas来实现。第二个包Sciencepack一般是用于科学计算,而Mapload这个是用于数据转换成图表图形,让你更直观的看到这些数据背后的含义。



Shell是什么呢?具体来说Shell是一种工具,就好像编辑文档的word或者WPS一样,普遍运行于Linux系统。shell也分很多种。在5145这门课里,我们主要使用的是Bash, 它可以直接在电脑上运行,通过点开你的终端(terminal),这个程序就可以直接通过Bash运行。但是这门课我们对Bash的使用不需要掌握到很深,只需要简单的,比如说打开文件夹,打开文件夹里面的东西,或者备份某个文件,删除某个文件,用Bash运行Python程序等等,基本操作就可以,相对来说还是很容易的。



最后说R语言,和Python相比R是更专业化的工具,是专门用做数据分析的。R在数据分析的领域应用非常广泛,比如在可视化方面,数据可视化,database方面尤为突出。但是由于5145课程设置的原因,关于R的内容放在了非常靠后的位置,也是只需要比较基础的一些内容即可。


3
问小迷妹三:文科内容的部分好理解吗?


这门课的文科内容就小迷妹看来还是很有用的。一开始是从bigdata或者data science的大背景切入,讲讲一般的概念呀,未来的行业发展呀或者是未来的职业发展什么的。


比如说第一周,lecture主要讲了什么是数据科学,即从data中提取一些你平常字面上或者说字面上看不出来的东西,更深层次的insight,或者是更valuable的information,比如说数据的规律变化以及他们这边变化背后的原因。



然后就是数据,其实我们在5145这门课上不太关注数据的收集,主要关注的是数据的清洗和转化。之后要想得到更深层次的数据分析信息,或者是knowledge,我们就要通过各种各样的方式。


然后后面开始基本上就是展望了一下数据的未来和可能出现的相应职业。比如说数据科学家,数据分析师或者是数据工程师。以及他们应该掌握的一些技能,我觉得这些也是对学生未来职业发展提供了很多的导引和思路。


(Influence diagram示例)


还有相关的数据模型。比如说第三周讲了三个模型,value chain,annalistic level和influence diagram,重点是最后一个influence diagram,也就是影响力模型。除了三个模型之外,还有商业模型Business Model,就是描述了一个企业或者一个组织如何再社会上立足,然后如何盈利等等等等。


4
问小迷妹四:那有没有推荐的学习方法呢?


小迷妹个人认为,这门课大家一定要在早期阶段就打好基础。因为在前几周会着重涉及一些编程的基础知识,尤其是Python,如果没有掌握好的话,后面的作业会比较难做,比较辛苦。如果前几节课水过去了,等到快交作业的时候,你就会发现有些人已经做完了,而你连python的基本语法可能都不会。这个时候如果再想抓紧的话很可能来不及了!



平时的作业在编程方向这块,希望同学们在Tutorial,特别是早期打基础的时候,任何不会的东西都要及时提出来,然后在作业放出来之前就能把python基础的代码知识了解的七七八八了。老师肯定会提供两个网站给你做题,根据网上的题目,一步一步走下去,基本上就能把背景知识点都cover到了。



期末考试不会考察编程的内容(非机考),全部都是要求你动笔的理论题。就像是前面提到的各种模型啊,或者给你个case让你分析如何应用啊,或者分析通用模型下这个case是怎样的呀,就会对你每节课lecture的理解记忆有一定的要求。还会有一些没有标准答案的开放性问题,考察你自己的逻辑和思维能力。不过这样的考试也有一个好处那就是很适合最后的冲刺集中性复习,大圣教育这边也会提供很多资料和相关课程帮助大家一关一关过,做好每一个作业和考试的备战准备。


总之,FIT5145这门课十分实用,涉猎广泛。操作性和理论性都很强,虽然知识较为硬核,但有迹可循,只要方法得当学起来就不吃力,而且成就感十足。希望看完小迷妹唠叨了这么一大堆,能够帮助到所有马上将要开始这门课的小伙伴们。


5
问小迷妹五:大圣教育专属福利来一套?


这对于小迷妹来说是小菜一碟!只要大家微信上来找小迷妹,就能进入我们大圣教育FIT5145的资料分享群。受篇幅限制,详细的5145课程介绍(小迷妹现码四千多字)小迷妹之后会在群里和大家分享。之后的线上讲座,辅导老师限时入住等环节更会妥妥的安排,保证大家都能有所收获。



当然啦, Summer期间大圣教育FIT5145学期无忧班依然在火热招生中。这门自大圣教育创立起就开设的经典科目,Summer期间我们更量体裁衣,课程内容涵盖所有知识点和作业,考试内容。从第一节课到考试结束,我们专业的辅导老师和课程会守护你整个学期!暑期课程不吃力?那就把学业交给我们,然后尽情的享受你的假期吧~


谢谢大家!




END



我是英俊、帅气带点可爱的大队长

爱你们



墨尔本留学生俱乐部

一个略带闷骚的土澳留学生集合地


撩我



收藏 已赞