BA大数据专业课程详细解读
INFS6018 Managing Business Intelligence
这门课是BA专业下为数不多的没有期末考试的课程,在商业智能以及人工智能越来越普及的背景下,学校在近期开设了这门课程,主要涉及的内容有:数据质量、数据库、数据维度、Persona设计等。上课方式都为3小时的Seminar,两个小时讲课,一个小时小组分析商业案例。内容以概念为主,是一门比较好的入门课程,从中可以学到很多目前最新兴的商业智能知识。
不出意外的话应该还是由Daniel担任Co。传闻Daniel是学校花重金从英国挖过来的行业精英,他曾就职于全球很多家尖端科技公司和商业咨询公司。他本人的知识面是非常广的,可以从他那里学到很多行业里最新的资讯也是这门课很吸引人的一点。他个人对学生的作业质量要求其实不算非常高,但是因为他的经验和高度在那里了,如何在作业中展现出你的批判性思维和创新思维就是需要花时间花精力的事情了。
分数组成:期中35分+小组作业30分+小组演讲10分+个人总结25分
虽然接触的都是行业最新资讯,但是作业的设计还是比较中规中矩,总的来说没有很具有挑战性的作业。
• 小组作业包含report和演讲,report是设计三个虚拟的Persona, 用Tableau做简单的可视化分析,老师会提供数据源给你。演讲是在报告的基础上设计一份海报,最后一周开一个小小展览会,互相分享,老师现场提问并打分。
• 个人总结是让不少同学摸不着头脑的地方,要求就那么直白,回顾你一学期学到了什么,对你以后有什么帮助,要求1000字。很多人会不知道写什么,也不知道如何写出彩。其实Daniel就是很看重你自己的收获。正确的思路应该是,比如你在学习过程中遇到了什么困难,你是怎么克服的,这对你以后学习有什么帮助,不是写流水账。按照Daniel的说法就是,我不会把鱼给你,我要教你怎么钓鱼。授人以鱼不如授人以渔!
35%的期中考试,是会在考试前给你一个全新的案例,然后用你前面几周学到的知识自己先进行分析做准备,考试中是有5-8道简答题,几道题关于lecture内容,几道题关于这个案例。问题很简短也不复杂,平均分大约为26/35,注意批判性思维的运用,简单来说,就不是问A答A,而是要由A联系到BC。比如问你,什么是数据库,这题五分,如果你只回答一个definition,最多给你两分,你需要说的还有数据库在什么时候使用,甚至有什么缺点,以此来体现你学习的融会贯通,是这门课考察的重点。不过不用担心,这门课难度不高,只要好好整理每周的知识内容,都能轻松达到平均分以上的。
BUSS6002 Data Science in Bussiness
BUSS6002这门课主要是要让大家掌握Big data的含义、基础模型算法与实际应用,可以看作是BA的入门课。对于刚接触BA的同学来说,这门课能够有效地帮助同学们初步构建一个知识框架,便于后面的学习。整门课lecture包括三个模块,模块一是介绍big data和data science的一些基本概念,比如什么是big data,big data的重要性,数据分析的标准流程等;模块二是介绍数据分析的算法和工具,主要包括两大基础模型:linear regression和logistic regression,以及大数据的处理技术;模块三是Big Data在marketing中的运用,涉及到文本分析以及marketing的一些相关理论。总的来说这门课覆盖的知识体系较广但不深入,更进阶的知识会在QBUS6810,QBUS6850和MKTG的相关课程中涉及。
另外这门课还有2个小时的tutorial,这个tutorial会从Python的最基础语句开始教,内容都和你们的lecture还有作业高度相关,所以强烈建议大家尽量都去上,尤其是对于编程小白来说,这是妥妥的福利,一学期速成写代码不是梦!
这门课分为三个模块,不同的模块会由不同的老师来讲解。2019学年的co是Jie Yin,她是一位中国老师,也是模块二的lecturer。她的讲课风格比较细致有条理,偏向中国学生思维,对于同学们理解还是很有帮助的,建议大家可以多听听她的课。
分数组成:作业25% + 期中25% + 期末50%
根据课程主页,2020S1貌似只剩一个作业,这边还是先按照2019的情况说明一下,供同学们作为参考。2019有两个作业,一个是个人作业,一个是小组作业。个人作业给一组数据,然后进行简要的分析和建模,会用到模块一和二的知识。个人作业涉及到的代码通常在tutorial上都有涉及,但是难点在于如果对于tutorial内容不熟悉的话,就需要耗费大量的时间。而且有些同学之前没有Python基础或者基础比较薄弱的话,光看代码未必就能理解。这也就是为什么强调大家都去上tutorial。
小组作业是编程+写一个report, 涉及到的代码主要来自于模块三的内容。通常是给定一组真实的用户数据,进行文本,帮助做一个市场决策。小组要求的是4人,除非有特别情况可以3人或5人。建议大家在组队时确保能力互补,既有编程好的,又有写作好的。趁早组队!
期中考题型是选择题+理论题+计算题。理论题主要集中在1到3周,而计算题主要就是第5-6周的linear regression和logistic regression。另外选择题一般会有两三道Python代码的,这个一般来说刷一下往年的经典题目,问题也不大。
期末是20道选择题+5至6道大题,主要集中在期中考后的内容,以及期中考未涉及的一些考点。大题中相对来说主要考察理论的理解,计算不难。
总体来说期中期末都是重理论,轻计算。而理论部分不单单是靠死记硬背,更重要的是理解,因为题目通常会考的比较灵活,所以建议大家在学习的时候多关注算法模型的原理。
QBUS6018 Business Operations Analysis
这门课主要涉及的是cross-sectional data,也是BA的入门课,这门课的很多内容与buss6002有较多的重叠,涉及的内容较广但是比较浅,这里就不一一列举了,许多内容都是只要简单的理解概念就可以,推荐的是与buss6002一起学,这样很多qbus6810略讲的地方比如MLE什么的能在6002中得到补充.另外QBUS6810也是6850的前置课,学好6810对于后面的课程学习帮助也是非常大的。
上学期换了co,据说事情特别多(当然事情多你能学到的东西也多)
分数组成:4个quiz(40分)+小组作业30分+期末30分
6810的group assignment也比较有意思,在kaggle与其他组竞赛,前三能获得bonus加分。主要就是给你一堆features,然后让你做EDA, feature engineering,modelling等(6002,6810,6850的作业基本都是一个套路),所有涉及的模型都会在tutorial中给出,你只需要照葫芦画瓢,改一些参数就可以了,report也比较好写就是写你做了什么。据说上学期给分非常友善。
这门课并没有期中考试,40%放在了4次quiz中,quiz考察的内容基本都是每周上课讲的,基本你只要理解了内容拿满分并不是很难,上学期quiz4改成了code,但是那个code非常简单,给的数据前所未有的纯净基本不用怎么处理,所以也不用担心什么。
而期末考试上学期普遍反应比较难,其实还好,如果课程内容掌握扎实,是非常简单的,因为6810的推导只有这么几题,最多就是换汤不换药(考不出那个范围),想拿高分并不是很困难的。而对于想pass的同学来说也没有什么困难,选择题有送分题,大题也还好。
QBUS6830 Financial Time Series and Forecasting
这门课主要涉及的是time series (时间序列)相关的内容,悉大涉及时间序列的课只有2门分别是QBUS6830和QBUS6840。而QBUS6830 是QF的必修课,这门课不管从内容上,作业上还是考试上都比QBUS6840困难许多(尤其是作业上)。在前面学期,主要介绍ARIMA以及time series data的基础概念(QBUS6840期末内容),而在后半学期主要研究ARCH,GARCH等对error term的建模。这门课的内容想理解需要花一定的时间,大部分都是关于模型假设的(不仅是关于time series的arima 还有线性回归的基础假设),如果学懂了,那对于后面所有qbus课程的学习是有非常巨大的帮助的,当然学不懂也不影响什么。
对于Matlab,tutorial上课基本不会讲code,需要自己花时间自学(在理解model的基础上还是能看懂的),matlab不像python这么简单易懂,加上tutorial基本上不讲code,所以学习起来难度还是有点大的。并且group assignment中涉及的代码量非常大,不过好在tutorial里有大部分的sample,大部分只需要改一两个数字就可以完成。
一直是一个co,个人感觉一般,tutorial的tutor们个人感觉也一般。
分数组成:期中20% + 小组作业(Matlab+report)40% + 期末40%
作业介绍:这门课在上学期改成了自己组队(之前都是随机分组),在这门课中找到好队友是非常关键的,作业量非常巨大,涉及整学期的所有模型,group assignment分成2次每次20分。期中考试是第一次,第一次assignment由于刚考完期中,所以相对比较容易;而第二次assignment涉及期末内容因此相对于第一次难一些,作业内容每组都是不一样的(其实这门课真的很看脸)。运气好抽到简单的model,report的什么都相对简单一些,运气不好抽到一些犄角旮旯的model,report会相对难写一些。值得一提的是,6830的tutor Bern会帮每个组检查code在due之前(只要你把结果email给他就行),并且如果你们是第一组给他邮件的,你们会获得加分。
考试相关:这门课在上学期中考试难度是比较大的,拿高分比较困难,期中考的比较灵活,说是时间序列,考的却是线性回归(当然基础好的同学是很容易很容易拿高分的)。而在期末难度明显上升,需要对于各类model有一定的理解以及运用。当然如果只是想要pass的同学,只要掌握推导即可(推导大部分都是代数,代数的逻辑都是一样的,只有非常非常小的一部分涉及求导)。
QBUS6840 Predictive Analytics
这门课主要涉及的是time series (时间序列)相关的内容,悉大涉及时间序列的课只有2门分别是QBUS6830和QBUS6840,而QBUS6840相比于QBUS6830不管从内容上,作业上还是考试上都简单许多。在前半学期,主要介绍一些简单易懂的模型naïve,drift,MA以及基础知识比如时间序列数据的decomposition等,而在后半学期中会讲到ARIMA以及SARIMA(QBUS6830期中前的内容)。至于后面的神经网络相关模型在6840中不是重点,需要理解的内容也非常简单易懂。
对于python的话,虽然code部分没有那么直观易懂,但是tutorial会非常全面的涉及到所有assignment中要用到的code,大部分可以直接copy并且学校也不会难为大家。另外QBUS6840的tutorial我个人认为是非常有用的,tutor会带大家每周复习lecture的内容重点,所以我强烈推荐每周的tutorial去上一下毕竟就一个小时。
上学期换了新co,上课容易让人睡着,但是QBUS6840的tutor们都非常不错,个人觉得如果没时间的话,tutorial大于lecture。
分数组成:个人作业(Python+report)15% + 期中20% + 小组作业(Python+report)30% + 期末35%
作业介绍:个人作业主要涉及的是用上半学期所教的CMA,SES等模型去分析数据以及预测。tutorial很多都讲过,内容也比较简单,给分也很友善,满分15(上限是17但最多只能拿15等于2分是送你的),基本上只要正常做都能拿14分左右。
小组作业report占50%,code占50%,这部分就比较有意思了,用整学期所教过的模型去预测,最后与老师的结果相评比。如果能超过老师的准确率,则不用写report也可以直接满分。个人作业所用过的model可以直接照搬,如果不想花心思或者对于代码掌握不是很好,也可以直接用SARIMA去做预测,最后代码部分也是能拿个85%左右的分数,而report部分基本给分都很高(接近于满分)。
考试相关:这门课考试内容相对简单,说是推导其实就是简单的代数,所有推导的逻辑都一样,许多人这门课学了什么都不知道但依然能拿一个非常高的分数。在上学期期中考试中,考了python相关的CMA(在tutorial中用3周时间非常详尽的讲了整个过程所以tutorial是非常重要的)。而在上学期期末考试中,考的内容非常简单,半个小时就能做完,所以是一门比较轻松并且容易拿高分的课程。
QBUS6850 Machine Learning for Business
这门课的先行课是QBUS6810。许多同学对6810的感受就是向你介绍不同的机器学习模型,但都是浅尝辄止,导致学起来会有些迷迷糊糊。而6850则是会侧重地对几个机器学习模型的算法原理进行更加深入的讲解。在你们已经有了6810铺垫的基础上,这门课学起来会更容易理解。具体结构可以参照下面这张图:
week 1主要是介绍一下机器学习的相关概念以及复习线性代数(Linear Algebra)的知识。这边大家重点关注一下线性代数的计算,考试里的公式推导题就会运用到这一块知识,此外计算题也会涉及。
Week 2和Week 3的前半部分回顾了监督性学习的两大基础算法:线性回归(linear regression)和逻辑回归(logistic regression)。这两个算法大家在qubs6810和buss6002都已经接触过了,所以理解上基本没什么问题,主要关注一下系数beta值的预测推导(会介绍除OLS以外的另一个求解方法:gradient descent)。另外还有bias和variance的权衡,learning curve的描绘,模型的正则化(例如Ridge、Lasso和Elastic Net)和特征工程(feature selection)。
总的来说前三周主要是对QBUS6810和BUSS6002的一个回顾,学过的话理解起来会轻松很多。
Week 4主要介绍了K-NN和K-Means两种算法,Week 5则是这门课的第一大难点——支持向量机(SVM)。支持向量机也是属于监督性学习(supervised learning),用于解决分类问题。难的原因一方面是许多同学之前都没接触过,另一方面是它涉及到的数学知识较多,理解起来相对抽象。Week 6介绍了决策树(decision tree)。之后课程的重心放在了gradient boosting , neural networks 还有 recommendation system,其中仍然涉及到许多的推导和计算,这些都是考试的重点。
另外这门课每周还有一个小时的tutorial。toturial也是紧密结合lecture的内容,通常会先通常会先带同学review一下当周的知识框架,然后讲解代码里的重要步骤,教你如何用代码实现算法,对于作业有很大的帮助。比如手动编写梯度下降算法,搜索最优 值,搭建神经网络等。而且教tutorial的tutor很多都是中国学长or学姐,人好心善、发音清晰、耐心答疑,还会给你的作业提供很多小tips,这一个小时买不了吃亏、买不了上当!
总的来说,虽然QBUS6850作为QBUS系的终极课程,听起来会让许多萌新瑟瑟发抖,但其实这门课能够从原理的角度帮助大家更好的理解机器学习算法,而且不会太过深入(毕竟这还是商科,不是数学系哈哈哈),所以大家完全可以不用怕、大胆选!
2019 S1&S2的co & lecturer是Chao Wang,非常好的一位中国老师。他讲课很细致,会在投影上仔细手写出推导和计算过程,很有逻辑地把原理讲得浅显易懂。而且他上课强调的知识点,sample和手写板书往往就是考试的重点,基本不会太为难大家。有时他会提到“xx公式同学们可以下课后自己推一推”,这个很有可能就是考试会出现的推导题。例如S1期中的推导题就是这样来的。
分数组成:期中25% + 小组作业(Python + Report)25% + 期末50%
作业介绍:根据课程主页,和buss6002类似,2020S1貌似只剩一个作业,这边也还是先按照2019的情况说明一下,供同学们作为参考。2019总共有三个作业,而且作业量比较大,非常酸爽。如果2012 S1只剩一个的话,无异于是一种解脱(不过可能考试难度就……)。2019 的两个个人作业都是有2-3个Task,task下又会细分成几个小问题,要求大家运用编程进行解决,然后写一份report。代码大部分都在tutorial里有覆盖到,除有个别小题较难。这两个个人作业大家如果提前多预留几天出来好好做,还是能拿高分的。
小组作业跟6810小组作业很像,就是给一组数据让你预测,例如Airbnb房价信息,没有规定用什么模型,然后在Kaggle上比误差值,前三名有bonus。除此之外可能会再额外增加一两个task考察9-12周的内容,比如搭建神经网络。小组通常是4-5人一队,具体看你们老师要求。如果一个小组里大家分工明确的话,每个人的任务量其实是比个人作业小很多的。所以这个作业的队友就非常关键了,一个好的小组基本就稳了一半哈哈哈。
考试相关:这门课考试期中每年都考类似的,所以高分很容易拿。一般是6-7个大题,没有选择题。大题包括概念题、计算题和公式推导题。通常来说概念题和计算题如果好好复习的话,还是比较好拿分的,基本都是lecture上的重点,不会太过于偏。公式推导题的话一般是基于现有的公式增加一两个条件,让你推导出新的公式。这种题型需要大家对线性代数以及老师课上讲的演算过程比较熟悉。而在上学期期末考试中,考的比较灵活,需要一定的理解。对于想拿高分的同学,需要花一定的心思,而对于仅仅想要pass的同学(这门课好像没挂过人,就是课程内容很烦就是了)
有用的选修课介绍
INFS6023 Data Visulisation
课程介绍:数据可视化现在不光只是IT行业的热门话题,也逐渐成为各行各业特别是商业分析和咨询行业的必备技能。这门课的主要内容就是手把手教你,拿到一堆数据后,应该如何结合商业需求、数据质量、道德、可视化设计、可视化展现方式,最后实现数据可视化的Story Telling功能。之前这门课是属于BA和BD专业下的,2020年新学期BA和BD合并后就划分到了BIS专业下。授课方式是3个小时Seminar,每节课有参与分,课程设置不复杂,作业量也不算大,关键是没有任何考试,可以节省不少时间学习别的课程。PASS是完全没问题的,几乎没听过有人挂科,但是要拿高分是很难的,想选择的同学可以自己平衡一下。这门课和INFS6018一样,不需要任何编程背景,会学习到Tableau Desktop和简单使用一下Tableau Prep,小组作业和个人作业都需要用Tableau Desktop完成,但是难度都不大。
这门课一般是一个Lecturer (也是Co) + 一个Tutor,Tutor上课辅助老师给学生参与分,并且批改作业。Lecturer如果不变的话,我个人认为授课方式中规中矩,不是很有趣味性的课程。
分数组成:课堂参与10分+个人作业15分+小组作业35分+小组演讲15分+个人总结25分
作业介绍:
1. 课堂参与分10分,上课只要举手回答问题就可以。前面几节课如果没有太多机会回答问题的话,老师会要求最后两到三节课必须出席听同学的presentation,然后提问来获得参与分。
2. 个人作业是文字报告+ 使用Tableau完成数据可视化分析。老师会让你先研究分析一下目前行业里数据可视化的趋势是什么并写成报告,接下来再用提供的数据完成数据可视化分析。由于目前数据可视化并不是一个有很多年学术研究成果的行业,所以在找资料的时候不会像金融或者QBUS的课程一样有很多学术报告可以查看,更多的是要在各类新闻或者行业峰会的记录报告里去找资料。关于Tableau的学习,老师会在课堂上带着你看一些Tableau的教学视频,由于Tableau本来就是个很容易上手的软件,所以整个作业的难度也不大,平均分是Credit左右。
3. 小组作业和演讲是在同一个小组,自己组队,因为要演讲所以不允许跨班组队。两个作业加起来50分,所以靠谱的组员还是很重要的。作业形式包含文字报告,Tableau Story和Inforgraphic,五到六人一组,每个部分之间有一些联系,所以组员需要一起讨论好再分任务行动。作业难度也不大,平均分也是60-65左右,但要想高分还是比较有挑战性的。
4. 个人总结包含几个部分,一个是对每一周都要进行一个小结,对数据可视化道德的反思,对小组合作的反思,以及对个人收获的总结,加起来一共2000字左右。因为分了好几个部分,写起来不会很费劲,但关键得分点还是和上面说的一样,如何在流水账一般的文字里写出新意,写得出彩,是这个作业拿高分的关键。
市场营销专业
课程 | 详细 |
Mktg 6007 | 主要研究顾客行为 往年期中全部选择题选择题 期末为short answer question 题型相对单一 简单
|
Mktg 6003 | 主要研究如何设计市场营销战略 作业分为小组论文 小组演讲和期末 题型主要考察发散性思维 比较有趣
|
Mktg 6004 | 讲如何做新产品上市 比较有趣的一门课 题型也不难 比较容易拿高分 |
Mktg 6005 | 也是比较水的一门课 容易拿高分 |
Mktg 6006 | 非常有趣的一门课 主要是叫你怎么使用social media 做marketing 设计型作业比较多 喜欢设计的同学一定要报这门 |
Mktg 6013 | 根mktg5001 和6003 有很多重叠的地方 期中全部选择题 期末题型不难有题库 容易拿高分
|
Ibus6001 | 主要研究国际市场战略 没有期中考试 只有final 中间作业比较有趣 |
Ibus6002 | 非常简单的一门课 主要研究跨国文化的不同 以及国际谈判和交流 期中纯选择题 期末比例也不大 所以很好拿高分 |
END
文章内容部分参考自悉尼大学官网:https://sydney.edu.au/
更多详情请点击优跃教育官网:https://youyue.com.au/