大数据技术下的数据挖掘与分析培训
2017-04-12 18:07:00   来源:   评论:0 点击:

一、培训特色
本课程通过了解当前数据增长,出现海量数据的情况下,我们需要用到大数据的分析技术,通过大数据下的Hadoop集群开发架构及实践来进一步理解和实践大数据的开发,同时认识在运营环境下数据分析和数据挖掘的特点,主要介绍了大数据的相关思想及相关技术和应用案例,数据挖掘的基本理论和实际应用技术,包括数据分析方法、案例以及数据挖掘中的关联分析技术、分类和预测技术、聚类分析技术等。解释了如何将数据挖掘应用于解决实际问题,从而使你能将数据挖掘技术应用于自己的实际工作中去。课程还着重介绍了数据挖掘模型的建立与测试,以及数据挖掘结果的解释与验证以及数据分析和数据挖掘在相关行业的应用实例等内容。
本课程不是简单的数据挖掘的概念讲解,把技术、案例、问题结合起来,把理论实践化,让学者能深入体会数据挖掘的应用。
二、 目标收益
通过本课程的教学,使学员充分了解和认识大数据的相关知识(大数据的应用范围及相关技术思想),通过大数据下的Hadoop集群开发架构及实践来进一步理解和实践大数据的开发;同时学会用主流的数据挖掘软件完成数据挖掘建模任务,使学员掌握数据挖掘方法论CRISP-DM的本质。通过几个具体的、典型的数据挖掘案例,使学员在掌握这些案例所用的技巧的同时,充分理解数据挖掘的方法论,实现举一反三的效果,提高学员分析问题解决问题的实际能力。
 
第一部分大数据知识进阶
1.大数据的本质
   海量非结构化数据本身+处理方法
2.大数据为什么重要及大数据带来的机遇
   决定了公司是否有未来和业务可延伸范围
3.对大数据的深层理解
 大数据的组成及特点介绍
4.大数据的相关技术与应用案例
5.大数据专题可能的演进路径
第二部分:数据分析进阶
1.认识数据分析:
   1)数据分析的含义
   2)数据分析主要做什么?
2.为什么要学习做好数据分析
   1)从数据分析的描述问题、对比问题、分析问题 到最后解决问题说明为什么要做好
   2)通过案例说明一般人员与数据分析师的区别
 3.数据分析的误区和分析的关键
 4.数据分析的6个步骤,3大方向(理清思路,寻找答案,观点表达)
 实践:以客户数据分析项目为引子,学习怎样将数据分析的技能与具体业务项目结合起来应用于实际的工作之中
  
第三部分:数据挖掘进阶
1、数据挖掘的思想
数据挖掘基本思想
数据挖掘历史发展进程
数据挖掘主要功能
数据挖掘的发展趋势
2、数据挖掘方法论
CRISP-DM
SEMMA
3、数据处理过程
变量和数据
变量的分类及类型
数据的质量
数据理解过程
数据准备过程
第四部分:基于大数据的HADOOP架构及开发
1、Hadoop分布式基础  
2、Hadoop安装部署
3、Hadoop管理操作
4、Hadoop组成
5、MapReduce开发初步
 实践:HADOOP集群模拟及HADOOP的开发实践。
第五部分:数据挖掘及数据分析技术
1.数据挖掘主要分析方法:
1.聚类分析(Clustering)
2.分类分析(Classification)
3.关联分析(Association)
4.预测分析(Prediction)
5.回归分析
6.相关分析
7.数据比较分析
8.数据挖掘的可视化
2.数据挖掘的实施
3.分析图形:正态性检验描述性统计箱型图、区间图、时序图介绍
4.数据挖掘的关键技术:数据预处理
5.数据挖掘效果的评估
实践:SPSS结合相应的分析算法及展示图形
 
第六部分:构建数据挖掘分析体系
1、分析团队建设
2、分析工作管理
3、数据分析核心能力建设
4、分析工作与业务协同
第七部分.数据挖掘应用
1.数据挖掘及管理经验
2.数据挖掘在金融、电商、运营商行业领域的应用举例
2.1 客户行为与潜在客户分析
2.2  用户信用度分析
2.3趋势预测
2.4新产品交叉营销分析等
3.结合业务场景需求,进行数据挖掘实践:
1.客户细分聚类分析实践
2.金融贷款防欺诈挖掘分析
3.金融/电商客户流失预测挖掘分析
以上涉及当下主流的聚类、相关、决策树、神经网络及回归分析等
 
(结合SPSS软件)
实践:内容包括从设计->形成模型->应用. 
  4.结合Hadoop大数据技术进行大数据挖掘的实践导入
第八部分数据挖掘工具及未来研究的方向和热点
1.几种数据挖掘工具比较
2.典型工具介绍及使用范围
3.如何选择数据挖掘工具
4.数据挖掘的方向和热点

相关热词搜索:数据挖掘 大数据 Hadoop

上一篇:项目管理必学的软件Project
下一篇:催眠学国际认证

分享到: 收藏