澳洲学习数据科学什么体验,Kaggle竞赛入门介绍,一篇就够了

原创 2019年11月27日 澳洲IT圈


文| Chris

编辑| Chris

在澳洲学习数据科学,是什么样的体验?

大学的内容依然摆脱不了与公司脱节的问题

学的同学感觉

自己浑身武功,但是无处伸展

自己浑身本领,但是无处展示


也许这一个平台可以帮你



Kaggle的Title就写着:Kaggle是Data Science的家



Kaggle是什么?

kaggle新版页面

Kaggle成立于2010年,是一个进行数据发掘和预测竞赛的在线平台,目前已经被Google收购,是全球顶级的权威性数据科学竞赛平台

Kaggle可以分为Competitions竞赛、Datasets数据集以及Kernel内核三个子平台、配套的Forum论坛模块以及供各类公司或组织招聘人才的Jobs模块。

从公司的角度来讲,可以提供一些数据、问题描述、期望的指标,进而提出一个实际需要解决的问题,以竞赛的形式向广大的数据科学家征集解决方案。

从参赛者的角度来讲,他们将组队参与项目,将数据下载下来,分析数据。然后针对其中一个问题,运用机器学习,数据挖掘等知识,建立算法模型,解决问题得出结果针对其中一个问题提出解决方案,最终由公司选出的最佳方案可以获得5K-10K美金的奖金。

幼儿园话

 公司提供项目以及奖金来吸引数据科学方面的同学竞赛,优胜者获得奖牌和奖励


除此之外,Kaggle官方每年还会举办一次大规模的竞赛,奖金高达一百万美金,吸引了广大的数据科学爱好者参与其中。从某种角度来讲,大家可以把它理解为一个众包平台。


但是不同于传统的低层次劳动力需求,Kaggle一直致力于解决业界难题,因此也创造了一种全新的劳动力市场——不再以学历和工作经验作为唯一的人才评判标准,而是着眼于个人技能,为顶尖人才和公司之间搭建了一座桥梁


Kaggle的竞赛模式

Kaggle上的竞赛有各种分类,例如奖金极高竞争激烈的的 “Featured”,相对平民化的 “Research”等等。但他们整体的项目模式是一样的,就是通过出题方给予的训练集体建立模型,再利用测试集酸楚结果用来评比

同时,每个进行中的竞赛项目都会显示剩余时间、参与的队伍数量以及奖金金额,并且还会实时更新选手排位。在截止日期之前,所有队伍都可以自由加入竞赛,或者对已经提交的方案进行完善,因此排名也会不断变动,不到最后一刻谁都不知道花落谁家

由于这类问题并没有标准答案,只有无限逼近最优解,所以这样的模式可以激励参与者提出更好的方案,甚至推动整个行业的发展。

Kaggle竞赛另一个有趣的地方在于每个人都有自己的Profile,上面会显示所有自己参与过的项目、活跃度、实时排位、历史最佳排位等,不仅看上去非常有成就感,更能在求职和申请的时候起到Certificate的作用。

Kaggle的参赛者

从比赛目标出发,参赛者主要分为两种,一种是以奖金和排名为目的,包括靠奖金为生的职业Kaggler;另外一种就是以提升相关skills和背景为目的业余爱好者甚至在校学生了。

从背景来看,前者的来源主要有丰富data science、data mining、machine learning工作经验的业内人士,或者是实力强劲的民间“技术宅”;而后者则往往是一些有一定技术能力,但经验欠缺,从中进行学习和锻炼的“长江后浪”。

理论上将,Kaggle欢迎任何数据科学的爱好者,不过实际上,要想真的参与其中,还是有一定门槛的。从比赛目标出发,参赛者主要分为两种,一种是以奖金和排名为目的,包括靠奖金为生的职业Kaggler;另外一种就是以提升相关skills和背景为目的业余爱好者甚至在校学生了

从背景来看,前者的来源主要有丰富data science、data mining、machine learning工作经验的业内人士,或者是实力强劲的民间“技术宅”;而后者则往往是一些有一定技术能力,但经验欠缺,从中进行学习和锻炼的“长江后浪”。


Kaggle能给你什么
Kaggle可以说是世界上最大的数据科学家、机器学习开发者社区
这个竞赛社区,在全球拥有超过80万数据科学家的关注,有众多知名公司or研究机构,发布自己接近真实的业务/研究数据和高额奖金,悬赏寻求最好最新的解决办法,甚至给出顶尖的工作机会。

Kaggle提供了一个介于“完美”与真实之间的过渡,问题的定义基本良好,却夹着或多或少的难点,一般没有完全成熟的解决方案。

在参赛过程中与论坛上的其他参赛者互动,能不断地获得启发,受益良多。即使对于一些学有所成的高手乃至大牛,参加Kaggle也常常会获得很多启发,与来着世界各地的队伍进行厮杀的刺激更让人欲罢不能。
刺激!刺激!刺激!
更重要的是,Kaggle是业界普通承认的竞赛平台,能从Kaggle上的一些高质量竞赛获取好名次,是对自己实力极好的证明,还能给自己的简历增光添彩如果能获得金牌,杀入奖金池,那更是名利双收啦~


因此,选择一场合适的 Kaggle 比赛 为自己的出道项目,能够:


  • 给转专业小白带来真实的背景提升


  • 得到一个被学界业界广泛认可的证明


  • 参与到社区讨论,学到更优秀的思考路径


  • 说不定的高额奖金 or 工作机会


如果你是一个

打算转行数据分析或者数据科学的初学者,

或者一个想要从事类似职业

但苦于没有经验和背景证明自己的同学,

Kaggle是否让你心动了呢?


什么?

对如何着手开始准备Kaggle比赛还有疑问?

害怕拿不到好成绩不能为自己的建立加分?

没关系!

匠人学院金牌导师

带你组队打Kaggle


由四位数据方面老师,理论+实战Kaggle形式


S老师,计算机本科硕士博士科班出身,RMIT客座讲师,数据科学家高级研究员。8年以上人工智能算法以及应用相关经验,对于优化算法、机器学习和深度学习有资深研究经验。课程负责理论知识的梳理


R老师,热爱Kaggle竞赛,目前达成Competition Master(2金2银),现任职于澳洲某银行。负责带领学生打Kaggle,指导拿奖牌



G老师,澳洲八大博士,研究方向为机器学习。前知名IT企业实验室实习生,现在澳洲知名咨询公司从事技术咨询。课程负责简历


A老师,拥有7年数据工作经验,参与了众多中国于澳洲DW/BI/Big Data/AI项目。现任澳洲某知名银行数据工程师,熟悉和精通数据项目各阶段及全流程。


现在参与课程的学生都拿到了奖牌,有几位同学通过奖牌去了Big Names公司



扫码二维码添加客服

获取更多详细咨询哦


收藏 已赞