详解数据挖掘的技术、工具与用例 什么是数据挖掘( 二 )
7.回归
作为一种简单的白盒技术,回归技术可被用于识别出,数据集中变量之间的因果关系、或相关性质 。它在数据建模和预测等方面非常实用 。
8.顺序模式
此类数据挖掘技术关注于发现和挖掘一系列顺序发生的事件,因此常被用于事务性的数据环境中 。例如,它可以预测某个顾客在最初购买了某种样式的鞋后,最有可能去购买哪些相配的服装 。顺序模式可以帮助企业向客户推荐并销售其他增值项产品 。
9.预测
预测分析是指在当前或历史的数据中,对发现到的模式进行扩展,以便企业根据现有数据,洞察到即将发生的趋势 。我们既可以使用简单的算法,又可以运用高级的机器学习和人工智能来实现预测分析 。
10.决策树
作为一种特定类型的预测模型,决策树可以让企业有效地提取所需的数据 。从技术上说,决策树属于一种极其简单的“白盒”类机器学习技术 。而从效果上说,决策树能够使用户清楚地了解到,输入数据是如何影响结果的 。当有多个决策树模型被组合在一起时,它们将创建所谓随机森林的预测分析模型 。由于输入并不总能被轻易地猜测其输出结果,因此复杂的随机森林模型常被视为“黑盒”类机器学习技术 。当然,在大多数情况下,相比单纯地使用决策树,集成建模的基本形式要更为准确一些 。
11.神经网络
作为一种特定类型的机器学习模型,神经网络通常能够与AI、以及深度学习协同使用 。由于该网络具有类似于人脑中神经元的不同功能层,因此它被誉为目前最精确的机器学习模型之一 。
12.可视化
数据可视化可以在数据挖掘的过程中,为用户提供可查看到的数据视图 。目前,数据可视化可用于实时数据流的传输场景中,以不同的颜色、动态地展示数据中的不同趋势和模式 。企业不仅能够使用统计模型中的数值结果,还可以用基于不同指标的仪表板,来可视化地突显数据中的模式 。
13.统计技术
作为数据挖掘过程的核心,统计技术基于统计的概念,利用不同的分析模型,产生适用于特定业务目标的数值 。例如,神经网络可以使用基于不同权重和度量的复杂统计信息,来确定被输入到图像识别系统中的图片上,到底是狗、还是猫 。
14.长时记忆处理(Long-term Memory Processing)
长时记忆处理是指能够长时间分析数据的能力 。那些存储在数据仓库中的历史数据可被用于此目的 。企业需要通过长时分析,来识别出原本难以检测到的模式 。例如,通过分析过去几年的人员流失情况,企业可以找到可能导致账务恶化的蛛丝马迹 。
15.数据仓库
从传统上说,数据仓库是将结构化的数据,存储在关系型数据库管理系统中,以便对其进行商业智能化分析、报告,并提供基本的仪表板显示 。目前,业界有基于云端的数据仓库、以及半结构化和非结构化的数据仓库(如Hadoop) 。过去,数据仓库主要处理的是历史数据 。如今,它也能够利用各种现代化技术与方法,实时地提供对于数据的深入分析 。
16.机器学习与人工智能
诸如深度学习之类的高级机器学习形式,在处理大规模的数据时,可以提供较高准确性的预测 。因此,它们可以被用在实施AI过程中的数据处理,其中包括:计算机视觉、语音识别、以及使用自然语言处理的复杂文本分析等 。此类数据挖掘技术有助于识别半结构化和非结构化的数据价值 。
数据挖掘的重要性
筛选并滤除数据中各种混杂与重复性“噪声” 。识别相关数据,并用其评估可能出现的结果 。加快企业做出明智决策的过程 。
数据挖掘的优势
可协助企业获取基于知识(knowledge-based)的信息 。可以被部署并实施在新的或既有的平台上 。可协助企业在生产和运营中按需进行调整 。促进趋势和行为的自动化预测,以及隐藏模式的自动发现 。相比其他统计数据类型的应用,更加经济高效 。有助于改进决策的过程 。作为一个快速的过程,可以让用户轻松地在更少的时间内分析大量数据 。
十种数据挖掘工具
由于数据挖掘过程是在数据被获取后立即执行的,因此找到那些能够针对不同数据结构进行分类、分析与挖掘的工具,是至关重要的 。下面,让我们来讨论十种业界常用的挖掘工具 。
1. Oracle Data Mining
Oracle Data Mining(也称为ODM)是Oracle高级分析数据库(Advanced Analytics Database)的一个模块 。该数据挖掘工具既能够方便数据分析师生成详细的数据见解,并做出预测;又可以协助识别到交叉销售(Cross-sells)的机会,开发出用户画像(profiles),并最终预测用户的行为 。
推荐阅读
- 河蚌体内珍珠的形成过程是
- 12w灯泡一小时耗电量
- 10h是什么意思
- 猫屎咖啡是真的猫屎吗
- 牛肉是属于发的东西吗
- 辣椒酱的制作方法及配料
- 监控不显示画面怎么办
- 13妖什么牌
- 苹果x手机电池容量是多少
- x和xs外观区别是什么
