壹佰网|ERP100 - 企业信息化知识门户

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 2504|回复: 2

基于Hyperion Essbase 数据库的数据挖掘

[复制链接]
发表于 2012/5/30 14:40:57 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。如果您注册时有任何问题请联系客服QQ: 83569622  。

您需要 登录 才可以下载或查看,没有帐号?注册

x
Hyperion Essbase 内置了6种数据挖掘的算法,关联规则算法 、群集算法 、决策树算法 、朴素贝叶斯算法 、神经网络算法 、回归算法 。当然也可以通过JAVA自己写数据挖据的算法。在已有的Essbase多维数据库上,构建相应的算法。挖据数据之间的关系,找出问题所在。1、关联规则算法使用关联规则算法发现一系列事件中的规则。
此算法的典型应用是购物篮分析:购买特定项的人也购买了其他项。例如,购物篮分析的结果可能是购买啤酒的人也购买了尿布。
定义算法的支持和置信度参数。算法将从预定项集中选择十分常见的子集。在输入过程中,它会读取一些项集,并查找某个项集(或子集),该项集在所有项集中的频率高于支持级别。这种项集会分解为前因后果对,这就是所谓的规则。规则置信度是指相应的项集频率与所有项集中前因频率的比率。置信度大于给定置信度级别的规则会被添加到信任规则列表中。
虽然这种算法在计算中使用了逻辑上的捷径,因而无需考虑项集的所有组合方式(组合方式的数量接近无穷大),但是算法执行的速度仍与要考虑的属性数以及属性出现的频率相关。


2、群集算法
可以使用群集算法来进行无监督式分类。
该算法可检查数据并基于数据的某些属性自行确定如何将其划分为多个组或群集。生成模型所需的输入由一组带数字系数的向量构成。该算法将根据这些向量之间的近似程度将它们组织到群集中。基本的假设是,群集相对来说小于各个向量之间的距离,因此可以通过它们各自的中心来实际表示。这样,模型就由若干中心向量坐标组成。
您可指定要生成的最大群集数。该算法为各群集分配的 ID 是连续的。在应用阶段,该算法会为每个输入向量分配最合适的群集 ID。
由于该方法的随机特性,针对同一个训练组的连续运行可能会产生略为不同的结果。

3、决策树算法
使用决策树算法来组织属于几个不同分类或类型的数据集合。在构建阶段,指定一组数据数据向量,并提供各向量的分类。在应用阶段,提供一组先前未知的向量,而该算法会从模型推断出其分类。
该算法会构造一系列简单的测试或预测值来创建树结构。要确定数据向量的分类,该算法取得输入数据,然后从根部到叶遍历该树,在每一分支上执行测试。
对于分类属性,测试就是从全部可能的属性值中选出单个属性值的过程。对于数字属性,测试就是将属性值与特定的阈值进行比较的过程,该阈值是通过算法预先计算出的。测试的结果无非是分配了目标分类属性或者选择了另一个属性进行进一步的测试。搜索总是会导致最终的目标分配。算法的目的是尽可能构造最紧凑的树,同时仍保持最小误分类数。

4、朴素贝叶斯算法
朴素贝叶斯算法是一种轻量级的分类算法。
朴素贝叶斯速度快,占用内存小,并且在很多应用中的表现都令人满意,因此可以首先考虑使用它,然后再考虑使用决策树,或者使用成熟的群集方案。
该算法预测分类成员身份概率。该算法将实例向量的所有属性均视为彼此独立的。它利用一系列训练向量以及条件概率的理论定义来计算具有特定值的属性属于某一特定分类实例的概

5、神经网络算法
既可用于预测,也可用于分类。
该算法比线性回归更强大并更灵活。例如,您可指定多个目标值以及多个预测值。
而另一方面,同线性回归相比,神经网络算法生成的模型比较难于解释。
6、多元回归算法
可以识别特定值和其他值之间的相关性。
线性回归算法最简单的形式是通过使用直线来对数据进行建模。响应变量 Y 作为预测值变量 X 的线性函数进行建模。
在更为复杂的形式上,多元线性回归算法通过构建与数据拟合的超平面来对基于几个预测值的响应向量进行建模。该模型所生成的系数是直线或平面的 Y 截距以及直线或平面的斜率。多元线性回归算法使用最小平方法来计算回归系数。
在应用阶段,模型系数通过输入预测值来预测目标。
预测值和目标值
该算法根据独立变量(预测值)的值来预测依赖变量(目标变量)的值。
例如,已知东部地区第一季度的电视机、DVD 播放机和 VCR 的销量,那么同一时期在同一地区的照相机的销量是多少?销售数据限于前一年的实值。
挖掘向导通过使用一组预测值及您所提供的 MDX 目标表达式向数据挖掘框架提供信息。


该贴已经同步到 gaoyiming的微博
发表于 2012/5/30 16:36:04 | 显示全部楼层
这篇文章很有深度,适合技术人员参考
发表于 2012/7/4 16:05:36 | 显示全部楼层
请问有没有具体操作的文档呢
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|Archiver|小黑屋|手机版|壹佰网 ERP100 ( 京ICP备19053597号-2 )

Copyright © 2005-2012 北京海之大网络技术有限责任公司 服务器托管由互联互通
手机:13911575376
网站技术点击发送消息给对方83569622   广告&合作 点击发送消息给对方27675401   点击发送消息给对方634043306   咨询及人才点击发送消息给对方138011526

GMT+8, 2025/11/29 07:51 , Processed in 0.022867 second(s), 18 queries , File On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表