1
cxe2v 2013-07-24 09:08:32 +08:00
嗯,大数据确实不是巨量数据,那个哥们确实是纯装逼,哎,这种人多了去了,专心好做你自己的,你就能在看似牛人一片的地方脱颖而出
|
2
RisingV 2013-07-24 09:12:37 +08:00 1
概念上没有什么需要自己添加理解的余地。
就是数据量大到传统的关系型数据库等技术难以处理,就叫大数据。 所以需要Mapreduce+GFS这样的分布式暴力计算框架和分布式文件系统来处理。 关键差别在哪里?后者省时间、省设备,归根结底就是省钱。 以前叫海量数据,学术词,问题变普遍了,顺口一点就叫大数据。 或许你想表达的是高精度的数据挖掘和大数据之间没有必然关系,这是对的。 但是,大数据就是大数据,不需要大家来“横看成岭侧成峰” |
3
RisingV 2013-07-24 09:14:08 +08:00
“千分之一样本数据没超过单机内存就不要自称大数据”。这话一点也没说错!
|
4
est 2013-07-24 09:14:54 +08:00
> 《大数据时代》里面有人通过统计十年的相扑比赛结果,再配合上升段时间节点,以及对手双方的胜率,就可以发现到底相扑选手是否作弊。《大数据》里面,有人搜集了美国的各个机场的航班晚点情况,就可以预测出当天的航班是否可能会晚点。
那么请给出这是 大数据 ,而不是传统的 数据建模 和 统计分析 有区别的地方? http://en.wikipedia.org/wiki/Big_data > Big data is a collection of data sets so large and complex that it becomes difficult to process using on-hand database management tools or traditional data processing applications. 说你这两个例子叫装逼还是拔高了。这两个例子纯粹2b |
5
RisingV 2013-07-24 09:16:14 +08:00
“Big data[1][2] is a collection of data sets so large and complex that it becomes difficult to process using on-hand database management tools or traditional data processing applications.”
http://en.wikipedia.org/wiki/Big_data 维基百科也写得很清楚了。那哥们一点也没说错。 |
6
Narcissu5 2013-07-24 09:22:21 +08:00
最近感觉流行中的大数据的概念越发向中医或者气功一类的东西靠拢了。
|
7
zhttty 2013-07-24 09:22:49 +08:00
不要钻牛角尖,big data 确实就是大数据,海量级,PB级。
但是大数据的分析方法确实可以通用到很多分析领域。 前者是定义,后者是方法,你不能说用了大数据的分析方法分析的数据就成了大数据,这是逻辑颠倒的误区。 |
8
dimfox 2013-07-24 09:49:01 +08:00
所有的名词成为时尚之后,都会被人将内涵不断扩大。所以没必要太计较确切的定义。
|
9
likuku 2013-07-24 09:59:43 +08:00
有时也可能是100G的数据必须1分钟内完成统计报表,那么可能需要非常贵的单机才搞得定,来一组"大数据"机群来跑就有可能完成。
|
10
avichen 2013-07-24 11:58:12 +08:00
@likuku 非常贵的单机和一组"大数据"机群从价钱上有分别吗?不都是一样需要很大的投资成本。呵呵,你这个不是重点。
我觉得重点是可以把很多分散的计算能力统一起来合理利用,这才是大数据时代云计算的根本内涵。 |
11
luikore 2013-07-24 12:06:10 +08:00
buzzword 会被各种人因应自己的便利更改含义, 特别是搞营销的...
宅, 黑客, 有机... 之类的词早就和原来意思差 10 万 8 千里了 |
12
plprapper 2013-07-24 12:22:49 +08:00
呵呵 真给他海量数据,他会说 需要加机器。。。
|
13
quake0day 2013-07-24 12:42:36 +08:00
本身大数据就是个和云计算一样模糊的概念,怎么解读也都不为过。但我认为数据本身的大小很重要,大数据研究的就是数据过大后如何对数据做有效的传输,存储和处理。
否则10G数据要是也叫做大数据,就是数据维度广些,那么和普通的统计分析有啥区别? |
14
likexian 2013-07-24 12:54:56 +08:00
|
15
luikore 2013-07-24 13:05:39 +08:00
两条新财路:
出售双色球历史购票记录超大数据1元/M, 里面用随机数生成就可以 出售ASIC双色球分析阵列电路, 随便焊个就可以, 但数字要液晶一个一个的跳出来效果特别好那种 |
16
likuku 2013-07-24 13:37:46 +08:00
@avichen 「我觉得重点是可以把很多分散的计算能力统一起来合理利用,这才是大数据时代云计算的根本内涵。」觉得我上面的主要意思也暗合了你这说法嘛。
|
20
shoumu 2013-07-24 18:39:32 +08:00
|
21
shoumu 2013-07-24 18:41:18 +08:00
听过一句话:“在高校里面讲云计算是道德败坏”
|
23
Ricepig 2013-07-24 20:50:42 +08:00
大数据时代应该和其他一些“大xx时代”一样理解
比如说我大巴萨V5,我大杭州V5这类 不是巴萨大,也不是杭州大,呵呵 |
24
shierji 2013-07-24 22:12:53 +08:00
@Ricepig 我赞同这个观点……还比如说我大帝都,我大重庆,我感觉这个大更多的是对数据的重视性和对大量数据的分析……但是并不是一定等于数据大
|
25
venmos 2013-07-25 04:27:42 +08:00
没有"大量"的数据,则没有"大数据"
|
26
monkeylyf 2013-07-25 07:52:18 +08:00 1
big data vs smart data
|
27
konakona 2014-04-17 19:45:50 +08:00
大数据是用来解决问题的,在业务的角度它是偏向抽象的、概念化的。
大数据是分析数据的名词。 过分的将大数据理解为“大的数据”是普遍错误的一种认知。这种“大的数据”早就存在了,例如Google、Facebook、Twitter、甚至是SNNA、GFW等。 光说大数据还不足以表明它能干什么,应该是大数据分析。 即便是100G也可以做大数据分析。 |
28
konakona 2014-04-17 19:47:54 +08:00
讲大数据就不要轻易谈论成本。因为大数据分析一整套解决方案,实施下来起步价是100W+。
如果只是走大数据分析的形式,则聘请相关专家,人天实施项目,成本会降低至几十万。 |
29
konakona 2014-04-17 19:50:55 +08:00
大数据指的是:基于数据量的数据分析方法。
形成有价值、可量化的结果,为营销和市场带来不可估量的收获。 大数据必然建立在数据上,但这数据不必是巨量的。而是可分析、有价值的数据。所以我说100G也可以做大数据分析。 50G没准都可以,不过普通的数据中含有大量的无用数据(比方说视频日志数据,会记录每几秒的操作,但其实每次只有1、2秒的数据具有分析价值)。所以可以变相的说:数据量越大,分析的结果越精准靠谱。 |