首页 > 留学资讯 > 澳洲留学辅导 > 澳洲UNSW MATH5836课程学习技巧指南

澳洲UNSW MATH5836课程学习技巧指南

作者:海马 发布时间:2023-08-11 10:17:28

我们产生的数据越多,就越难理解所有这些数据并从中获得有意义的见解。想想站在数以万亿计的树木中,你从哪里开始分析森林?数据挖掘为这一问题提供了解决方案,它改变了企业决策、降低成本和增加收入的方式。因此,各种数据科学职位都将挖掘作为日常职责的一部分。

数据挖掘通常被认为是一个具有挑战性的过程。然而,学习这门重要的数据科学学科并不像听起来那么困难。请继续阅读,全面了解数据挖掘的各种特点、用途和潜在就业方向。这篇文章为大家带来澳洲UNSW MATH5836课程学习技巧指南。MATH5836

一、课程概述

越来越多的企业需要分析庞大的数据集,以确定其中有用的结构。为此,近来开发了一系列统计和机器学习方法。本课程涵盖数据挖掘和机器学习的关键技术、理论背景和应用。主题包括线性和逻辑回归、神经网络、贝叶斯神经网络、聚类和降维、集合学习等方法,还介绍了深度学习。在 Python 和 R 等编程环境中,将使用新兴的机器学习工具和库来说明这些方法。

二、什么是数据挖掘?

数据挖掘最常见的定义是,利用计算机和自动化技术搜索大型数据集以寻找模式和趋势,并将这些发现转化为业务见解和预测的过程。数据挖掘超越了搜索过程,因为它使用数据来评估未来的可能性并开发可操作的分析。

三、数据挖掘与机器学习的区别

数据挖掘和机器学习都是独特的过程,通常被认为是同义词。然而,虽然它们都有助于检测大型数据集中的模式,但它们的运作方式却截然不同。

数据挖掘是在数据中发现模式的过程。数据挖掘的妙处在于,它通过算法主动识别非直观的数据模式(例如,购买花生酱的消费者更有可能购买纸巾),从而帮助回答我们不知道要问的问题。然而,对这些见解的解读以及将其应用于商业决策仍然需要人类的参与。

而机器学习则是教会计算机像人类一样学习的过程。通过机器学习,计算机可以学会如何确定概率,并根据数据分析做出预测。虽然机器学习有时会将数据挖掘作为其过程的一部分,但最终并不需要人类持续频繁地参与(例如,自动驾驶汽车依靠数据挖掘来确定在哪里停车、加速和转弯)。

四、数据挖掘的各个阶段

让我们仔细看看 CRISP-DM 的每个阶段:

1.业务理解

开始时,首先要问以下问题:我们的目标是什么?我们要解决什么问题?解决问题需要哪些数据?

如果不清楚要挖掘的正确数据,项目可能会产生错误、不准确的结果,或无法回答正确问题的结果。

2.了解数据

一旦确定了总体目标,就需要收集适当的数据。数据必须与主题相关,通常来自销售记录、客户调查和地理位置数据等各种来源。这一阶段的目标是确保数据正确包含所有必要的数据集,以实现目标。

3.数据准备

准备阶段是最耗时的阶段,包括三个步骤:提取、转换和加载,也称为 ETL。首先,从各种来源提取数据并存入暂存区。然后,在转换步骤中:清理数据、填充空集、删除重复数据、解决错误并将所有数据分配到表格中。最后一步是加载,将格式化后的数据加载到数据库中使用。

4.建模

数据建模涉及相关数据集,并考虑采用最佳统计和数学方法来回答目标问题。有多种建模技术可供选择,如分类、聚类和回归分析(稍后将详细介绍)。在同一数据上使用不同模型来解决特定目标的情况也很常见。

5.评估

模型建立并测试完成后,就需要评估它们在回答业务理解阶段确定的问题时的效率。这是一个人为驱动的阶段,因为项目负责人必须确定模型输出是否充分满足其目标。如果不能,可以创建不同的模型,或准备不同的数据。

6.部署

一旦数据挖掘模型被认为准确并成功地回答了目标问题,就该投入使用了。部署的形式可以是可视化演示或分享见解的报告。它还可以促成行动,如制定新的销售战略或实施降低风险的措施。

海马课堂专业课程辅导,2100+严选硕博学霸师资,针对学生的薄弱科目和学校教学进度,匹配背景相符的导师,根据学生情况进行1V1专属备课,上课时间灵活安排,中英双语详细讲解课程中的考点、 难点问题,并提供多方位的课后辅导,辅助学生掌握全部课程知识,补足短板。

相关热词搜索:

阅读原文:https://www.highmarktutor.com/news/14451_62.html

版权作品,未经海马课堂 highmarktutor.com 书面授权,严禁转载,违者将被追究法律责任。

热门课程推荐

欢迎咨询

hmkt088