不列颠哥伦比亚大学(UBC)的DSCI 100数据科学导论课程旨在让学生学会通过网络“抓取”(下载)数据,智能“整理”(管理)数据,并基于数据创建能清晰传达合理结论的表格和/或图表。学生将熟练运用工具发现数据模式并预测未来数据趋势。以下是对UBC DSCI100课程章节重点内容的详细解读。

一、章节重点内容
1、Chapter 1:数据科学导论
通过实践真实数据科学应用,学习使用R语言和Jupyter,包括从网络下载数据、将数据整理为可用格式,以及创建有效的数据可视化。
2、Chapter 2:本地与网络数据读取
学习读取本地及网络环境下的各类数据集。读取完成后,将运用这些数据集实践真实数据科学应用场景,包括将数据整理为可用格式并创建高效数据可视化。
3、Chapter 3:数据清洗与整理
聚焦数据清洗与整理工具的应用。仍将基于实际数据科学应用场景,持续通过完整案例实践:从网络下载数据、整理数据至可用格式,最终创建高效数据可视化。
4、Chapter 4:高效数据可视化
拓展数据可视化知识体系与工具集,超越现有实践范畴。突破散点图的局限,学习其他高效的数据可视化方法,并掌握可视化创作中的通用经验法则。所有可视化任务均将应用于真实数据集。
5、Chapter 6-7:分类
介绍基于K最近邻算法(k-nn)的分类。
6、Chapter 8:回归
介绍基于K最近邻算法(k-nn)的回归。重点探讨存在目标响应变量与单一解释变量时的预测场景。
7、Chapter 9:回归进阶
深入探索高维空间中的k-nn回归方法。同时开始在回归场景中对比k-nn与线性模型。
8、Chapter 10:聚类
介绍K均值聚类方法。
9、Chapter 11:统计推断导论
介绍样本均值与比例的抽样与估计方法。
10、Chapter 12:统计推断导论(续)
引入置信区间概念,并讲解通过引导法计算置信区间的具体方法。
二、课程学习成果
课程结束时,学生应能够:
• 通过计算读取来自多种来源的数据(本地及远程纯文本文件、电子表格和数据库);
• 将原始数据格式转换为符合特定用途的格式;
• 识别最常见的研究/统计问题类型,并将其映射至对应的数据分析方法;
• 基于整理后的数据创建并解读有意义的表格/图表;
• 应用并解读简单分类器与回归模型的输出结果;
• 使用简单分类器和回归模型进行预测并评估预测结果;
• 应用简单聚类算法并解读其输出结果;
• 区分样本内预测、样本外预测与交叉验证;
• 在统计推断背景下计算点估计值,并阐释其与总体量值的关联性;
• 运用合理、清晰、可复现且可共享的工作流程与沟通策略完成上述所有任务。
以上就是UBC DSCI100课程章节重点内容解析。如果学生在学习过程中遇到问题,可以立即与新航道的课程顾问联系。新航道将及时安排一对一不列颠哥伦比亚大学课程辅导,帮助学生解决课业疑问、掌握知识重点、消除学习难点,以获得满意的课业成绩。

咨询免费留学规划,加V:dulceslin
免费领取最新剑桥雅思、TPO、SAT真题,免费为孩子制定留学规划
4008-125-888
周一至周五9:00-22:00周六至周日9:00-18:00Copyright © sh.xhd.cn 新航道(北京)管理有咨询有限公司版权所有 总部地址:北京市海淀区中关村大街28-1号6层601
CP认证:京ICP备05069206号-5
京公网安备11010802021513号