奥克兰大学数据科学硕士课程的目的是让学生掌握数据科学领域的独特知识和技能,从而能够有效理解、处理和管理数据,从中提取价值。以下是对奥克兰大学数据科学硕士核心课程的详细解读,希望能帮助学生更好地进行学习。

一、COMPSCI 752 大数据管理
本课程将深入解析分布式与异构环境中的大数据建模、管理及分析。课程的目的是培养学生在分布式与异构环境中进行大数据建模及大规模数据管理的能力。
学习成果:
• 运用前沿的大数据表示形式,包括可扩展标记语言(XML)、JavaScript对象表示法(JSON)、图属性模型及NoSQL。
• 使用模式语言建模大数据,包括文档类型定义(DTD)、XML模式、JSON模式。
• 通过查询语言评估大数据,包括XPath、XQuery、Cypher、Spark SQL。
• 理解并批判性评估大数据管理与分析方法,包括搜索、索引及处理技术(如PageRank、MapReduce、Spark和区块链技术)。
• 以小组形式向师生展示关于大数据前沿知识的联合理解成果(需制作幻灯片)。
• 阐明大数据在实际应用中实现可扩展性、实用性与隐私保护的挑战及权衡关系。
二、COMPSCI 760 机器学习高级专题
本课程将概述学习问题及基于搜索的学习视角。内容涵盖决策树学习、规则学习、穷举学习、贝叶斯学习、遗传算法、强化学习、神经网络、解释性学习与归纳逻辑编程等高级学习技术。同时,学生将掌握理解机器学习研究所需的高级实验方法。
课程的实践环节要求学生在教学团队协助下开展真实研究项目,涵盖研究问题定义、项目规划、数据分析流程、编程实现、团队协作及定期口头/书面进度汇报,包括撰写文献综述与最终研究报告。本课程要求具备编程技能,实践环节需以小组形式开展。
学习成果:
• 阐述所有机器学习算法均有其理论基础,并能描述若干算法的理论根基。
• 论证特定算法在特定数据集上表现优异,而不同数据集需采用不同算法的理论,即不存在适用于所有数据集的万能算法 。
• 在4-5人小组中,运用适当的机器学习方法论和开源数据集,独立设计并完成解决实际问题的研究项目。
• 设计优质实验方案以验证基础研究问题,确保实验结果能有效支持所探讨的核心命题 。
三、STATS 763:高级回归方法论
本课程旨在介绍回归建模理论与方法的核心内容,涵盖广义线性模型、广义加性模型、生存分析。平滑与半参数回归。相关数据的边缘模型与条件模型。预测模型选择与混杂因素控制。模型批判与检验。模型拟合计算方法(含贝叶斯方法)。
课程将从广义线性模型切入,涵盖参数化、半参数化与非参数化模型视角,运用图形化方法分析数据与模型,探讨非线性建模,并进行预测与因果推断的模型选择。此外还将涉及抽样误差、测量误差、缺失数据、截尾数据,若时间允许还将分析纵向数据的简单案例。
对预测性与因果推断的扎实理解是统计学与数据科学的基础,本课程旨在培养学生独立开展统计分析的能力。
学习成果:
• 描述广义线性模型的组成部分,并识别不同类型广义线性模型的适用场景。
• 理解并解释测量误差、缺失数据、抽样和截尾对回归建模的影响。
• 运用交叉验证为特定数据集选择合适的预测模型,并评估模型精度。
• 针对特定情境构建因果图,并利用该图识别解释变量间的混杂关系。
• 运用引导法生成广义线性模型参数的抽样分布。
• 运用拟合回归模型解答解释变量与响应变量间关系的具体问题。
• 运用适当图形技术探索变量间关系。
• 阐释准确与不准确预测模型在社会中的伦理风险。
• 理解并阐释广义线性模型推断如何依赖于数据生成过程的假设。
四、STATS 769:高级数据科学实践
本课程旨在培养学生获取、处理及分析大规模和/或复杂数据集所需的计算概念与技能。 次要目标是让学生实践应用数据挖掘技术、数据挖掘工具、数据库操作、并行计算及大内存计算。课程内容涵盖数据库、SQL、脚本编写、分布式计算及其他数据技术。
学习成果:
• 运用处理大规模和/或复杂数据集所需的计算概念与技能。
• 通过相关技术导论开展数据挖掘工作。
• 处理各类数据格式与数据库。
• 阐述并行计算与大内存计算的核心原理。
• 运用书面沟通技能,清晰简洁地传递知识要点。
以上就是奥克兰大学数据科学硕士核心课程的主要内容。如果有同学在课程学习过程中遇到问题,随时可以联系新航道的课程顾问。新航道能够及时安排一对一奥克兰大学课程辅导,帮助你解决课业疑问、消除学习短板、巩固知识要点,使你在后续的课程和评估任务中有更好的表现。
免费领取最新剑桥雅思、TPO、SAT真题,免费为孩子制定留学规划
4008-125-888
周一至周五9:00-22:00周六至周日9:00-18:00Copyright © sh.xhd.cn 新航道(北京)管理有咨询有限公司版权所有 总部地址:北京市海淀区中关村大街28-1号6层601
CP认证:京ICP备05069206号-5
京公网安备11010802021513号