文 | 灯泡点灯
编辑 | 灯泡点灯
时长 | 一支烟的时间
课程详情
通过介绍数据工程,数据分析和数据科学带领学生理解数据全栈 ,了解数据的行业背景,职业前景和职业发展方向。
完整的一个项目贯穿整个数据全栈课程, 灵活运跟着导师学习和实战,获得case经验和团队协作经验。
适合人群
想从事数据科学方向工作的有一定基础的IT学生
想获得宝贵项目经验并转方向的在职人员
想通过项目积累经验找相关工作的学生
IT或CS专业毕业生
收费
$4,700(线下早鸟价)$5,200(原价)
$3,500(线上)
形式:小班授课(10人开班)线上直播+线下授课
时长:80+ hours + career coaching
地点:悉尼(线下),布里斯班(线上),墨尔本(线上)
课程特色
Master DBMS,Snowflake data warehouse
AWS IAM, S3, EC2, ECS, DynamoDB, RedShift, Elasticache, RDS,VPC, Kinesis,lambda
Data engineering pipeline :ETL,spark and ETL tool-Matillion
Data Warehouse
Data Analytics & Modelling
Data Visualization: Tableau
Deliver Value to Business
Kaggle projects
Data wrangling with Python & R
Statistical modelling for data analysis
Exploratory data analysis
Machine Learning
定制化的Career Coaching
简历改修及面试指导
IT匠人社群Networking与内推资
申请职位
BI Developer
Data Analyst
ETL Developer
Database Developer
Junior Data Engineer
Machine Learning engineer
Associate Data Scientist
优惠政策
两人同行 各优惠$150
转发本文章立减 $50
课程大纲
课程设置由三部分组成:
整个课程会由数据工程(DE)数据分析( DA)和数据科学(DS)和 career coaching 四部分组成,整个课程会由一个数据项目贯穿,三个部分分别还有一些小项目作为练习和实践。
完整项目简介
通过分析和处理零售行业客户的订单和销售数据,来预测客户下次最可能买入的商品。
此项目非常全面的涵盖了一个数据科学项目最实用的内容:从需求分析做起,一直到数据处理,数据建模,机器建模和可视化。
第一部分 : Data Engineering (共计40+小时)
DBMS - ER Model
Overview of DBMS
Components of DBMS
Database Architecture
Types of Database Model
ER Model: Basic Concepts
ER Model: Creating ER Diagram
ER Model: Generalization and Specialization
项目操作
学生通过on-line research找到可能存在于company, department,employee以及其他entities之间的联系;基于research结果,亲自设计和实现ER图,基于ER图设计数据库以及各个表的详细内容。
可提高学生自学能力,深入了解ER图,完成ER图到数据库的实现。
SQL介绍
SQL Constraints
SQL function
SQL Join
SQL Alias
SQL SET operation
SQL Sequences
SQL Views
SQL Analytical Function
项目操作
学生亲自搭建Snowflake数据库环境,根据源数据设计数据库以及各个表的详细内容,载入数据,并且根据需求完成相应的查询。
可以使学生更加深入了解数据库,并且熟练掌握SQL。
Unix/Linux Shell
学习基础的File Management,Directory Management,File Permission, Environment,Pipes and Filters,Processes Management和Network Communication Utilities。
再通过The vi Editor,scripts,Variables,Arrays,Basic Operators,if…else语句,Loop,Loop Control,Substitution,Quoting Mechanisms,Input/Output Redirections,Functions完整理解shell。
AWS和GitHub学习
Data Engineering Pipeline
Data extraction/ingestion
Data pre-processing
Data Transformation
Data Loading
Data Warehouse
Data visualisation
Data pipeline and automation
项目操作 1
按照商业要求构建数据仓库,建立dimension和fact表;根据所学ETL知识,设计实现数据处理流程。
此目的是让学生深入了解data pipeline的相关知识。
项目操作2
根据所提供数据集,构建表结构,并且完成简单的数据可视化任务。
目的是让学习回顾数据仓库的知识,并且学习使用数据可视化工具,实现简单的数据分析。
第二部分 :Data Analysis(共计20+小时)
通过学习数据建模,数据可视化,数据报表,数据分析(Modelling, Visualization, Report )和对工具的了解来帮助学员了解我们的目的,会通过Kaggle案例练习实操数据项目。
Data Analytics & Modelling Introduction
该部分会学习案例学习帮助更加系统地理解数据分析和数据建模
What is data analytics?
Non modelling analysis
Modelling analysis
What is modelling?
Problem analysis
Get data and data cleaning
Feature selection & engineering
Build model
Test & optimise model performance
Output visualisation & reporting
Python introduction
Basic functions
Loop
If statement
Function
Module import
Tuple, list, dictionary
Linear regression
What’s linear regression?
Definition
Assumptions
Maximum Likelihood
Kaggle linear regression example part :
What’s Kaggle?
Why Kaggle?
How to use Kaggle?
House Prices
Data check
Feature selection
Feature engineering
Build model
Check model performance
Data visualization
Model optimisation
What’s logistic regression?
Definition
Assumptions
Maximum Likelihood
Data modeling
Problem analysis
Get data and data cleaning
Feature selection & engineering
Build model
Test & optimise model performance
Output visualisation & reporting
学习怎样Deliver Value to Business,如何成功有效的交流沟通。
Goal
Story telling
Data visualisation
Common pitfall
What users are thinking
项目操作
学生在导师的指导下搭建Python的使用平台,并根据分析建模的相关知识,进行相应的数据清理,特征选择, 建立模型,以及模型优化等操作。最后,学生可以参加真实的Kaggle竞赛,通过实际操作巩固所学到的数据分析以及建模知识。
第三部分:Data Science(共计20+小时)
Data wrangling with Python
Python basics
Regular expressions
Process-based parallelism
Interacting with web
Big data with Python
Project case study
Statistical modelling for data analysis
Introduction to modeling for data science
Data analysis
Regression correlation and clustering
Statistical inference and evaluation
Project case study(market basket analysis – data consolidation and statistical analysis)
Exploratory data analysis (EDA)
Introduction to data exploration and visualization
Analysis of tabular and spatial data
Analysis of relational and textual data
A complete walk through of data exploration process
Project case study
Machine Learning
Statistical learning and how to assessing model accuracy
Linear Model Selection and Regularization
Tree-Based Methods
Feature engineering
Support vector machine
Unsupervised learning
Gradient boosting model deep dive
Time seres modeling
Neural networks
Gonvolutional networks
Project case study
项目操作
通过分析和处理零售行业客户的订单和销售数据,来预测客户下次最可能买入的商品。
此项目非常全面的涵盖了一个数据科学项目最实用的内容:从需求分析做起,一直到数据处理,数据建模,机器建模和可视化。通过这个项目学生基本上可以学习到如何去构建,分析并且处理一个商业中常见到的问题:预测。此项目包含了不止一个数据文件,建模的过程中也涉及到了很多的数据分析和处理,这样也考验了学生如何更好的处理在真实的商业环境中所遇到的问题,学生们在项目中所汲取的经验可以直接被应用到工作中。
第四部分:Career Coaching
CV
Interview
Mock Interview
面对未来时代的变化,学习一定关于数据分析和科学基础知识和实施被业界认可的项目实习是每一个IT人应具备的要求。
对于想从事数据行业的小伙伴,来IT匠人一起做项目,必是帮助你走入正确的入行道路的王牌!
欢迎2019年的新生
加入相应的大学新生群哦
澳洲IT匠人圈社群
作为澳洲领先的IT行业交流圈子,已经有8000多个小伙伴加入,从刚刚来澳洲的IT新生,到行业大神都在IT圈子里。分享工作机会,解答生活职业就业移民问题。一个有爱的圈子,期待同样有爱的你加入。
我们是谁
布里斯班 · 悉尼 · 墨尔本
打造澳洲IT精英圈 · 做信息时代的匠人
澳洲IT匠人圈 - 致力于做更好的IT专业人士组织。我们的初衷就是连接海内外的IT同仁,团结互助、工作内推、职场升迁。IT匠人圈为IT匠人旗下社群。IT匠人圈有一系列的品牌活动:Offer收割机、大咖面对面、匠人Workshop、匠人线上公开课、创业英雄会,活动开展以来反响强烈。
IT匠人服务有:培训课程,就业服务,大学课程辅导,人才猎头
文章投稿请联系小花或E-Mail
商务联系
匠人小花 | 微信 uniapp001