备案号:辽ICP备19007957号-1
聆听您的声音:feedback@highmark.com.cn企业热线:400-778-8318
Copyright ©2015- 海马课堂网络科技(大连)有限公司办公地址:辽宁省大连市高新技术产业园区火炬路32A号创业大厦A座18层1801室
公共和私人机构以及研究项目正在收集大量数据,而互联网则提供了有关人类生活和社会几乎方方面面的大量信息。对这些数据进行分析可以为企业带来巨大收益。本课程重点介绍数据挖掘领域的技术和研究。它侧重于算法和技术,而较少涉及数学和统计基础。这篇文章为大家带来澳洲ANU COMP3425 Data Mining课程指南。
一、学习成果
成功完成学业后,学生将掌握以下知识和技能
1.对数据挖掘过程中涉及的步骤进行批判性分析和论证。
2.预测和识别与数据挖掘相关的数据问题。
3.测试和应用数据挖掘中使用的主要算法和技术。
4.针对给定的数据挖掘问题,论证适合使用的技术。
5.使用适当的测量方法评估和思考数据挖掘项目的结果。
6.思考数据挖掘的伦理和社会影响。
二、什么是数据挖掘?
数据挖掘是对大型数据集进行分类的过程,通过数据分析找出有助于解决业务问题的模式和关系。数据挖掘技术和工具使企业能够预测未来趋势,并做出更明智的业务决策。
数据挖掘是整个数据分析的关键部分,也是数据科学的核心学科之一,它使用先进的分析技术在数据集中寻找有用的信息。在更细的层面上,数据挖掘是数据库知识发现(KDD)过程中的一个步骤,是一种收集、处理和分析数据的数据科学方法。数据挖掘和 KDD 有时可以互换使用,但它们通常被视为不同的事物。
三、数据挖掘为何重要?
数据挖掘是企业成功实施分析计划的重要组成部分。数据挖掘生成的信息可用于涉及历史数据分析的商业智能(BI)和高级分析应用,以及用于检查创建或收集的流数据的实时分析应用。
有效的数据挖掘有助于规划业务战略和管理运营的各个方面。这包括面向客户的功能,如市场营销、广告、销售和客户支持,以及制造、供应链管理、财务和人力资源。数据挖掘支持欺诈检测、风险管理、网络安全规划和许多其他关键业务用例。数据挖掘在医疗保健、政府、科学研究、数学、体育等领域也发挥着重要作用。
四、数据挖掘过程四个主要阶段:
1.数据收集。确定并收集分析应用所需的相关数据。数据可能位于不同的源系统、数据仓库或数据湖中,数据湖是大数据环境中越来越常见的存储库,包含结构化和非结构化数据。也可以使用外部数据源。无论数据来自哪里,数据科学家通常都会将其转移到数据湖中,以完成流程中的其余步骤。
2.数据准备。这一阶段包括一系列步骤,以便为挖掘数据做好准备。首先是数据探索、剖析和预处理,然后是数据清理工作,以修复错误和其他数据质量问题。除非数据科学家希望针对特定应用分析未经过滤的原始数据,否则还要进行数据转换,以使数据集保持一致。
3.挖掘数据。数据准备就绪后,数据科学家会选择合适的数据挖掘技术,然后实施一种或多种算法进行挖掘。在机器学习应用中,算法通常必须先在样本数据集上进行训练,以寻找所需的信息,然后再在全套数据集上运行。
4.数据分析和解释。数据挖掘结果可用于创建分析模型,帮助推动决策和其他业务行动。数据科学家或数据科学团队的其他成员还必须向业务主管和用户传达研究结果,通常是通过数据可视化和使用数据叙事技术。
海马课堂专业课程辅导,2100+严选硕博学霸师资,针对学生的薄弱科目和学校教学进度,匹配背景相符的导师,根据学生情况进行1V1专属备课,上课时间灵活安排,中英双语详细讲解课程中的考点、 难点问题,并提供多方位的课后辅导,辅助学生掌握全部课程知识,补足短板。
阅读原文:https://www.highmarktutor.com/news/14492_62.html
版权作品,未经海马课堂 highmarktutor.com 书面授权,严禁转载,违者将被追究法律责任。
24h在线客服



备案号:辽ICP备19007957号-1
聆听您的声音:feedback@highmark.com.cn企业热线:400-778-8318
Copyright ©2015- 海马课堂网络科技(大连)有限公司办公地址:辽宁省大连市高新技术产业园区火炬路32A号创业大厦A座18层1801室
hmkt088