壹佰网|ERP100 - 企业信息化知识门户

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 1975|回复: 3

[其他] 非结构化大数据数据挖掘与分析探讨,希望对这一块有研究的朋友能够各抒己见

[复制链接]
发表于 2013/7/2 16:59:35 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。如果您注册时有任何问题请联系客服QQ: 83569622  。

您需要 登录 才可以下载或查看,没有帐号?注册

x
对于非结构化的大数据(包括视频、音频、图片、文档等),如何进行数据挖掘与分析,请大家进行探讨,提出可行解决方案,推荐相关软硬件产品。

按照我的理解从非结构化信息中先提取出结构化数据就已经巨难了,再从结构化数据中进行挖掘分析,也是巨难的,现有的算法与硬件很难支持;
希望对这一块有研究的朋友能够各抒己见,大家互相交流;


本帖被以下淘专辑推荐:

发表于 2013/7/9 09:07:55 | 显示全部楼层
我们现在也在做这个非结构化数据的处理,可以一起学习
发表于 2013/7/9 12:47:00 | 显示全部楼层
本帖最后由 diaowf 于 2013/7/9 13:04 编辑

   在云计算出现之前,传统的计算机是无法处理如此量大、并且不规则的“非结构数据的”。以云计算为基础的信息存储、分享和挖掘手段,可以便宜、有效的将这些大量、告诉、多变化的终端数据存储下来,并随时进行分析与计算。

       数据化不是数字化
         数据化和数字化
   数据化是指一种把现象转变为可制表分析的量化形式的过程。
         数字化是指把模拟数据转换成0和1表示的二进制码,这样电脑就可以处理这些数据了。

        20世纪90年代,我们主要对文本进行数字化,随着过去的几十年里存储能力,处理能力和宽带的提高,我们也能对图像、视频和音乐等类似的内容执行这种转化。

       1  为了得到可量化的信息,我们要知道如何计量;

       2  为了数据化量化了的信息,我们要知道怎么记录计量的结果。这需要我们拥有正确的工具。

       计量和记录的需求是我们数据化的前提。

       计量和记录一起促成了数据的诞生

       --  待续(后面我会列举部分实例,敬请关注!)

发表于 2013/7/15 22:08:58 | 显示全部楼层
  对于多媒体数据库挖掘,需要将存储和检索技术与标准的数据挖掘方法集成在一起。比较好的方法包括构建多媒体数据方、多媒体数据的多特征提取和基于相似的模式匹配
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|Archiver|小黑屋|手机版|壹佰网 ERP100 ( 京ICP备19053597号-2 )

Copyright © 2005-2012 北京海之大网络技术有限责任公司 服务器托管由互联互通
手机:13911575376
网站技术点击发送消息给对方83569622   广告&合作 点击发送消息给对方27675401   点击发送消息给对方634043306   咨询及人才点击发送消息给对方138011526

GMT+8, 2025/11/28 22:27 , Processed in 0.023431 second(s), 21 queries , File On.

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表