那
从2020的第一学期开始,悉大对原有的专业和课程做了调整,原先的Big Data专业也整合到了BA专业。总体来说,BA作为近年来的热门专业,就业前景广阔,但同时难度也是比较大的。一方面它对于数理统计的相关知识要求比较高,另一方面还需要运用编程技术。这个专业需要很强的自学能力,老师在课堂上授课的内容相对于考试和应学内容来说是比较浅的,所以课后需要同学们在网络和图书馆找各种资料来补充学习。
QBUS5001
作业 25% + 期中25% + 期末50%
BUSS6002这门课主要是要让大家掌握Big data的含义、基础模型算法与实际应用,可以看作是BA的入门课。对于刚接触BA的同学来说,这门课能够有效地帮助同学们初步构建一个知识框架,便于后面的学习。整门课lecture包括三个模块,模块一是介绍big data和data science的一些基本概念,比如什么是big data,big data的重要性,数据分析的标准流程等;模块二是介绍数据分析的算法和工具,主要包括两大基础模型:linear regression和logistic regression,以及大数据的处理技术;模块三是Big Data在marketing中的运用,涉及到文本分析以及marketing的一些相关理论。总的来说这门课覆盖的知识体系较广但不深入,更进阶的知识会在QBUS6810,QBUS6850和MKT的相关课程中涉及。
另外这门课还有2个小时的tutorial,这个tutorial会从Python的最基础语句开始教,内容都和你们的lecture还有作业高度相关,所以强烈建议大家尽量都去上,尤其是对于编程小白来说,这是妥妥的福利,一学期速成写代码不是梦!
这门课分为三个模块,不同的模块会由不同的老师来讲解。2019学年的co是Jie Yin,她是一位中国老师,也是模块二的lecturer。她的讲课风格比较细致有条理,偏向中国学生思维,对于同学们理解还是很有帮助的,建议大家可以多听听她的课。
根据课程主页,2020S1貌似只剩一个作业,这边还是先按照2019的情况说明一下,供同学们作为参考。2019有两个作业,一个是个人作业,一个是小组作业。个人作业给一组数据,然后进行简要的分析和建模,会用到模块一和二的知识。个人作业涉及到的代码通常在tutorial上都有涉及,但是难点在于如果对于tutorial内容不熟悉的话,就需要耗费大量的时间。而且有些同学之前没有Python基础或者基础比较薄弱的话,光看代码未必就能理解。这也就是为什么强调大家都去上tutorial。
小组作业是编程+写一个report, 涉及到的代码主要来自于模块三的内容。通常是给定一组真实的用户数据,进行文本,帮助做一个市场决策。小组要求的是4人,除非有特别情况可以3人或5人。建议大家在组队时确保能力互补,既有编程好的,又有写作好的。趁早组队!
推荐指数:五颗星
作业难度:三星半
考试难度:三星半
老师友好:五颗星
软件技能锻炼(python):五颗星
pass难度:低
HD难度:中
与其他课程相关:qbus6810,qbus6850
先修要求:
QBUS5001
分数组成:
4个quiz(40分)+小组作业30分+期末30分
而期末考试上学期普遍反应比较难,其实还好,如果课程内容掌握扎实,是非常简单的,因为6810的推导只有这么几题,最多就是换汤不换药(考不出那个范围),想拿高分并不是很困难的。而对于想pass的同学来说也没有什么困难,选择题有送分题,大题也还好。
推荐指数:五颗星
作业难度:三颗星
考试难度:四星
老师友好:三颗星(上学期quiz一直搞事情,但是assignment给分都挺高)
软件技能锻炼(python):四颗星
pass难度:低
hd难度:低
与其他课程相关:buss6002,qbus6840,qbus6850.
先修要求:
QBUS5001
分数组成:
期中20% + 小组作业(Matlab+report)40% + 期末40%
对于Matlab,tutorial上课基本不会讲code,需要自己花时间自学(在理解model的基础上还是能看懂的),matlab不像python这么 简单易懂,加上tutorial基本上不讲code,所以学习起来难度还是 有点大的。并且group assignment中涉及的代码量非常大,不过 好在tutorial里有大部分的sample,大部分只需要改一两个数字就 可以完成。
老师介绍:
一直是一个co,个人感觉一般,tutorial的tutor们个人感觉也一般。
推荐指数:三颗星(如果想对模型假设有进一步理解的BA同学可以选择,对于学习qbus课程的提升还是挺大的,QF的同学不选也得选)
作业难度:五颗星
考试难度:五星
老师友好:五颗星(虽然难,老师不会挂人,作业给分也挺高)
软件技能锻炼(matlab):五颗星
pass难度:低
hd难度:高
与其他课程相关:qbus6840
先修要求:
这门课主要涉及的是time series (时间序列)相关的内容,悉大涉及时间序列的课只有2门分别是QBUS6830和QBUS6840,而QBUS6840相比于QBUS6830不管从内容上,作业上还是考试上都简单许多。在前半学期,主要介绍一些简单易懂的模型naïve,drift,MA以及基础知识比如时间序列数据的decomposition等,而在后半学期中会讲到ARIMA以及SARIMA(QBUS6830期中前的内容),至于后面的神经网络相关模型在6840中不是重点,需要理解的内容也非常简单易懂。
对于python的话,虽然code部分没有那么直观易懂但是tutorial会非常全面的涉及到所有assignment中要用到的code,大部分可以直接copy并且学校也不会难为大家。另外QBUS6840的tutorial我个人认为是非常有用的,tutor会带大家每周复习lecture的内容重点,所以我强烈推荐每周的tutorial去上一下毕竟就一个小时。
个人作业主要涉及的是用上半学期所教的CMA,SES等模型去分析数据以及预测,tutorial很多都讲过,内容也比较简单,给分也很友善,满分15(上限是17但最多只能拿15等于2分是送你的),基本上只要正常做都能拿14分左右。
小组作业report占50%,code占50%,这部分就比较有意思了,用整学期所教过的模型去预测,最后与老师的结果相评比,如果能超过老师的准确率,则不用写report也可以直接满分。个人作业所用过的model可以直接照搬,如果不想花心思或者对于代码掌握不是很好,也可以直接用SARIMA去做预测,最后代码部分也是能拿个85%左右的分数,而report部分基本给分都很高(接近于满分)。
推荐指数:五颗星
作业难度:三颗星
考试难度:三星
老师友好:五颗星
软件技能锻炼(python):五颗星
pass难度:低
hd难度:低
与其他课程相关:qbus6830,极少部分内容与qbus6810和qbus6850相关。
Qbus6850
先修要求:
分数组成:
期中25% + 小组作业(Python + Report)25% + 期末50%
week 1主要是介绍一下机器学习的相关概念以及复习线性代数(Linear Algebra)的知识。这边大家重点关注一下线性代数的计算,考试里的公式推导题就会运用到这一块知识,此外计算题也会涉及。
Week 2和Week 3的前半部分回顾了监督性学习的两大基础算法:线性回归(linear regression)和逻辑回归(logistic regression)。这两个算法大家在qubs6810和buss6002都已经接触过了,所以理解上基本没什么问题,主要关注一下系数beta值的预测推导(会介绍除OLS以外的另一个求解方法:gradient descent)。另外还有bias和variance的权衡,learning curve的描绘,模型的正则化(例如Ridge、Lasso和Elastic Net)和特征工程(feature selection)。
总的来说前三周主要是对QBUS6810和BUSS6002的一个回顾,学过的话理解起来会轻松很多。
Week 4主要介绍了K-NN和K-Means两种算法,Week 5则是这门课的第一大难点——支持向量机(SVM)。支持向量机也是属于监督性学习(supervised learning),用于解决分类问题。难的原因一方面是许多同学之前都没接触过,另一方面是它涉及到的数学知识较多,理解起来相对抽象。Week 6介绍了决策树(decision tree)。之后课程的重心放在了gradient boosting , neural networks 还有 recommendation system,其中仍然涉及到许多的推导和计算,这些都是考试的重点。
另外这门课每周还有一个小时的tutorial。toturial也是紧密结合lecture的内容,通常会先通常会先带同学review一下当周的知识框架,然后讲解代码里的重要步骤,教你如何用代码实现算法,对于作业有很大的帮助。比如手动编写梯度下降算法,搜索最优 值,搭建神经网络等。而且教tutorial的tutor很多都是中国学长or学姐,人好心善、发音清晰、耐心答疑,还会给你的作业提供很多小tips,这一个小时买不了吃亏、买不了上当!
总的来说,虽然QBUS6850作为QBUS系的终极课程,听起来会让许多萌新瑟瑟发抖,但其实这门课能够从原理的角度帮助大家更好的理解机器学习算法,而且不会太过深入(毕竟这还是商科,不是数学系哈哈哈),所以大家完全可以不用怕、大胆选!
根据课程主页,和buss6002类似,2020S1貌似只剩一个作业,这边也还是先按照2019的情况说明一下,供同学们作为参考。2019总共有三个作业,而且作业量比较大,非常酸爽。如果2012 S1只剩一个的话,无异于是一种解脱(不过可能考试难度就……)。2019 的两个个人作业都是有2-3个Task,task下又会细分成几个小问题,要求大家运用编程进行解决,然后写一份report。代码大部分都在tutorial里有覆盖到,除有个别小题较难。这两个个人作业大家如果提前多预留几天出来好好做,还是能拿高分的。
小组作业跟6810小组作业很像,就是给一组数据让你预测,例如Airbnb房价信息,没有规定用什么模型,然后在Kaggle上比误差值,前三名有bonus。除此之外可能会再额外增加一两个task考察9-12周的内容,比如搭建神经网络。小组通常是4-5人一队,具体看你们老师要求。如果一个小组里大家分工明确的话,每个人的任务量其实是比个人作业小很多的。所以这个作业的队友就非常关键了,一个好的小组基本就稳了一半哈哈哈。
推荐指数:五颗星
作业难度:四颗星
考试难度:四颗星
老师友好:五颗星
软件技能锻炼(python):五颗星
pass难度:低
hd难度:中
与其他课程相关:buss6002, qbus6810
我们隆重推出我们的主讲老师:
竟然有满分的成绩,学霸的不要不要的
我们下学期Qbus6810,qbus6830的课堂上看看老师的庐山真面目
END
往期精彩回顾